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Titel: Verfahren und Vorrichtung zur Datenverarbeitung 

Beschreibung 

5 

Die Erfindung betrifft das oberbegrif f lich Beanspruchte und 
befafit sich somit mit Verbesserungen bei multidimensionalen 
Feldern aus datenverarbeitenden Zellen zur Datenverarbeitung . 

10 

Es sind bereits mul'tidimensionale Felder ■ aus datenverarbei- 
tenden Zellen bekannt. Zur Gattu'ng dieser Bausteine zahlen 
insbesondere systolische Arrays , neuronale Netz'e, Mehrprozes- 
sor Systeme, Prozessoren mit mehreren Rechenwerken und/oder 
15 logischen Zellen und/oder koinmunikati-ven/peripheren Zellen 
(10), Vernetzungs- und NetzwerkbausteAne wie z.B. Crossbar- 
Schalter, ebenso wie bekannte Bausteine der Gattung FPGA, 
DPGA, Chameleon, XPUTER, etc.- Es sind insbesondere Bausteine 
bekannt r bei denen erste Zellen wahrend der Laufzeit ohne 

20 St5rung des Betriebes weiterer Zellen umkonfigurierbar sind, 

i 

vgl. etwa die folgenden Schutzrechte und Anmeldungen dessel- 
ben Anmelders: P 44 16 881. .0-53, DE 197 81 412.3, DE 197 81 
483.2, DE 196 54 846.2-53, DE 196 54 593.5-53, 
DE 197 04 044.6-53, DE 198 80 129.7, DE 198 61 088.2-53, 
25 DE 199 80 312.9, PCT/DE 00/01869, DE 100 36 627.9-33, 
DE 100 28 397.7, DE 101 10 530.4, DE 101 11 014.6, 
PCT/EP 00/10516, EP 01 102 674.7. Diese sind hiermit zu Of- 
fenbarungszwecken vollumfanglich eingegliedert. 

30 Die dergestalt aufgebauten Bausteine weisen eine hohe Lei- 
stungsfahigkeit auf; allerdings ist deren Einsatz aufgrund 
der hohen Kosten oftmals prohibitiv. Wo Kosten bei hohen 

- l - 
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Stuckzahlen besonders relevant sind, ist es daher derzeit iib- 
lich, dedizierte Logikschaltungen in Form von ASICS und 
dergl. vorzusehen. Diese habeh jedoch das Problem, besonders 
hohe Entwicklungskosten mit sich zu bringen, da sowohl der 
5 Entwurf der Schaltung als auch die Herstellung der Vielzahl 
von Masken teuer ist. 

Die Aufgabe der vorliegenden Erfindung besteht darin, Neues 
fur die gewerbliche Anwendung bereitzustellen. 

10 

• Die Losung dieser Aufgabe wird in unabhangiger Form bean- 
sprucht. Bevorzugte Ausfiihrungsformen finden sich in den 
Unteranspruchen . 

15 GemaU einem ersten Aspekt der vorliegenden ERfindung wird so- 
mit vorgeschlagen, dafi bei einer Datejiverarbeitungsanordnung 
mit einem multidimensionalen Feld in Funktion und/oder Ver- 
netzung konfigurierbarer Zellelemente und diesen zugeordneten 
Konf igurationsvorhalte-mitteln zum lokalen Konf igurations- 

20 Vorhalten, vorgesehen ist, daB die Konf igurationsvorhaltemit- 
tel dazu ausgebildet sind, zumindest einen Teil. der 
vorgehaltenen Konf igurationen. nichtf luchtig vorzuhalten.. 

Es wird demnach vorgeschlagen, die Leistungsfahigkeit der 
25 multidimensionalen Prozessorfelder dadurch zu optimieren, dafi 
zunSchst zwar eine Vielzahl von Zellen vorgesehen wird, die 
oer se zu einer groJSen Vielzahl verschiedener Funktionen be- 
fahigt sind, aber dann aus dieser Vielzahl verschiedener 
Funktionen nur eine oder wenige Funktionen far jede Zelle 
30 vorzusehen. Hierbei ergeben sich gegenuber dem dedizierten 
Schaltungswentwurf von Asics und dergl., bei denen exakt die 
jeweils fur die benotigten Funktionen erf orderlichen Schalt- 
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kreise vorgesehen werden, gravierende Kostenvorteile, weil 
Ruckgriff auf leicht programmierbare Einheiten oder durchge- 
testete Module genommen werdeh und so keine hohen 
Entwicklungs- und/oder Testkosten anfallen, und weil uberdies 
5 keine hohen Kosten fur eine Vielzahl von Masken entfallen, 
die beim Entwurf dedizierter Asics sonst fallig sind. Der 
Entwurf kann iiber herkommliche Entwurf sprogramme fur logische 
Schaltungen erfolgen, in denen Module fur die Zellen, Vernet- 
zungsarchitekturelemente usw. bereitgestellt werden, oder 
10 indent eine analoge, rekonf igurierbare Anordnung so konfigu- 
riert wird, bis sie die gewunschten Ergbenisse liefert und 
dann die entsprechende Funktionalitat in einer Anordnung fest 
vorgegeben wird. 

15 Besonders bevorzugt ist es, wenn die die Funktion grobgranu- 
lar konfigurierbar ist, d.h. wenn das. 

Konfigurations'vorhaltemittel nur wenige Bit vorhalten muJ5, urn 
eine jeweilige Funktion der Zelle zu bestimmen. Dies erleich- 
tert es, eine Vielzahl sukzessive abzuarbeitender 

20 Konfigurationen vorzuhalten, die aber jeweils oder zumindest 
zum Teil fest vorgegeben sind. Als Zellelemente konnen zumin- 
dest eines von ALUs, EAlUs, .RAM-Zellen, I/O-Zellen, 
Logiblocken vorgesehen sein. Es kann auch die Vernetzung 
grobgranular konfigurierbar seiri, d.h. es werden nuf wenige 

25 Bits zu setzen sein, urn die Vernetzung vorzusehen. In einer 
alternativen Weise ist es moglich, die Vernetzung zumindest 
weitgehend fest vorzugeben und nur die jeweilige Funktion zu 
variieren. Dies ist dann bevorzugt, wenn der fertige Baustein 
etwa in seiner Funktion wie bei der Wave-Rekonf iguration je- 

30 weils eine bestimmte einer vorgegebenen Anzahl von Funktionen 
ausfuhren soil, aber die Vernetzung selbst fest steht. Dazu 
kann in bestimm-ten Teilbereichen nur eine Nachste-Nachbar- 
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Verbindung vorgesehen werden (auf die parallel eingereichte 
Anmeldung des Anmelders betreffend die Erhohung der Nachste- 
Nachbar-Dimensionalitat bzw. -Konnektivitat sei zu Offenba- 
rungszwecken hingewiesen. ) , von denen einige der Nachste- 
5 Nachbar-Verbindungen aktiviert und einige deaktiviert sind. 
In anderen Bereicheri kann dagegen z.B. eine, erforderlichen- 
falls auch . lauf zeitrekonf igurierbar veranderliche 
Beschaltungsanordnung und/oder Busstruktur vorgesehen werden. 
Es sei darauf hingewiesen, dafi abhangig von den Benutzeran- 
10- forderungen eine Vielzahl unterschiedlicher Aufgaben mit 
einer bis auf die Konf igurationsvorgabe unveranderten Bau- 
steinen vorgesehen werden kann, so dafi sich Maskenkosten auf 
eine Vielzahl von Bausteinen verteilen und damit nicht mehr 
so stark ins Gewicht fallen. 

15 

Es ist bevorzugt, wenn jedem Zellelement ein eigenes Konfigu- 
rationsvorhaltemittel zugeordnet ist. Diese konnen die bei 
XPP-Architekturen vorgesehenen, von einem zentralen Konfigu- 
rationsspeicher zugreifbaren Konf igurationsregister ersetzen. 

20 Es ist moglich, in den Konf igurationsvorhaltemittel eine 
. Vielzahl von Konf igurationen vorzuhalten; dies erlaubt etwa 
die Rekonfiguration im Betrieb, ohne daB eine ebenfalls teure 
und Siliziiomflache erfordernde Konf igurationseinheit inte- 
griert sein mufl. Die Auswahl der jeweils zu aktivierenden 

25 Konf igurationen kann innerhalb des Feldes uber Statustrigger, 
Datenoperationen, Sequenceranordnungen etc. erfolgen. Es ist 
dabei auch bevorzugt, wenn mehrere fest vorgegebene nicht- 
fluchtige Konf igurationen im Konf igurationsvorhaltemittel 
vorgegeben sind. Alternativ sind fltlchtige und nichtf liichtige 

30 Konf igurationen einsetzbar. Es wird darauf hingewiesen, daB 
eine vollstandige oder partielle Konf igurationsvorgabe vor 
der oder jeder eigentlichen Inbetriebnahme erfolgen kann. Da- 
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zu konnen auf geeignete Weise eingegebene Daten als Konfigu- 
rationen behandelt werden, die abzulegen sind. Da solche eine 
Vorab-Ablage von Rekonf igurationsdaten nicht betreibssto- 
rungsfrei geschehen mul3, eroffnen sich hier weitere 
5 Moglichkeiten, die Architektur zu vereinf achen; auf das sog. 
Wormholerouting sei "hingewiesen, das bei lauf zeitrekonfigu- 
rierbaren Einheiten nicht funktioniert . Alternativ und/oder 
zusatzlich kann vorgesehen sein, dafi bei einigen Zellen im 
Betrieb mit veranderlichen Konf igurationen versehbare Konfi- 
10 gurationsvorhaltemittel vorgesehen sind, d.h. ein Teil der 

Zellen liber einen Konfigurationsmanager oder auf .andere Weise 
umkonf iguriert wird. 

Die wechselnde der Vielzahl von vorgehaltenen und/oder vor- 
15 bestiirtmten Konf igurationen, die jeweils zu verwenden ist, 
kann insbesondere im Wege der Wave-Rekonf iguration oder des 
lokalen Sequencing bestimmt bzw. geandert werden. 

Es ist mdglich, die Konf igurationsvorhaltemittel auszubilden 
20 als ROM, EPROM, EE PROM, Flash-Speicher, Fuse-, Antifuse- 
programmierbiare Speichermittel und/oder in insbesondere in 
oberen Lagen einer Siliziumstruktur fest vorgesehene Spei- 
chermittel gewahlt sind, Bespnders bevorzugt sind 
Anordriugnen, die leicht und einfach bei einer groBen Stuck- 
25 zahl die Konf iguration vorsehen. Dies ist durch geeignete 

Maskierung bei der Herstellugri auf den oberen Metalllagen er- 
reichbar (ZiB-.-Lage M4 und/oder M5) und/oder durch 
Fuse/Ant if use-Techniken. Letztere haben den Vorteil, dafi bei 
Funktionsanderungen in einer lauf enden Serie Anderungen 
30 leichter implementierbar sind. 
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Mit der Anordnung kann ein Baustein festgelegter Funktion er- 
halten werden, indem ein multidimensionales Feld mit in 
Funktion und/oder Vernetzung konf igurierbaren Zellelementen 
und diesen zugeordneten Konf igurationsvorhaltemitteln zum lo- 
5 kalen Konf igurations -Vorhalten vorgegeben wird, bestimmt 
wird, welche Konfigiirationen in diesen vorzuhalten sind, und 
dann nichtf luchtige Konf igurationsvorhaltemittel so vorgese- 
hen werden, dafi sie zumindest einen Teil der vorgehaltenen 
Konfigurationen nichtf luchtig vorhalten. Es kann dabei von 

10 einem zur lauf zeitrekonfigurierbaren multidimensionalen Feld 
ausgegangen werden, das ein hohere Funktionalitat besitzt und 
es kann dann das Design urn bestimmte Funktionen reduziert 
werden, bis ein Kern-Bauelelement oder -elementblock mit vor- 
gegebener Architektur erhalten wird, bei dem nur noch wenige 

15 freie Konfigurationen zu bestimmen sind. 

Dieser Aspekt der Erfindung wird beschrieben nur besipielhaft 
beschrieben mit Bezug auf die Zeichung, in welcher zeigt 

Fig Al eine erf indungsgemafie Datenverarbeitungsanorn- 
dung 

Fig A2 Details hierzu 

Nach Fig. 1 umfafit nun eine allgemein mit 1 bezeichnete Da- 
tenverarbeitungsanordnung 1 mit ' einem multidimensionalen Feld 
in Funktion und/oder Vernetzung konfigurierbarer Zellelemen- 
te 2 und diesen zugeordneten Konf igurationsvorhaltemitteln 2a 
zum lokalen Konf igurations -Vorhalten , wobei die Konfigurati- 
onsvorhaltemittel 2a dazu ausgebildet sind, zumindest einen 
Teil der vorgehaltenen Konfigurationen nichtfliichtig vorzu- 
halten. 



20 
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Das multidimensional Feld 1 umfafit im vorliegenden Beispiele 
jeweils drei Reihen und Spalten PAEs, wie sie aus den Ein- 
gangs erwahnten und weiteren Verof f entlichungen des Anmelders 
per se bekannt sind. Diese Einheiten weisen grobgranular kon- 
5 fuigurierbare ALUs 2b auf , an die iiber Multiplexer 2c Daten 
von einem Bussystem 2d eingehen und die beidseits mit Vor- 
warts-/Riickwartsregistern 2e, 2f wie per se bekannt flankiert 
sind. Weiter speisen sie Ausgangsdaten iiber einen weiteren 
Multiplexer 2g auf ein Bussystem in der Reihe darunter auf. 

10 Die Funktionsweise der Multiplexer 2g,2c sowie jene der ALU 
2b und der Register 2e,2f ist'pei: se bekannt und wird hier 
nicht detailliert erlautert. Die Konf iguration, die diese 
Einheiten haben, d.h. die Verbindung, die der Multiplexer je- 
weils aktiviert, bzw. die jeweilige Funktion der ALU, sind im 

15 Konf igurationsspeicher 2h abgelegt. Dabei konnen fur Se- 
quencing oder Wave-Re konf igu-rat ion eine Vielzahl von 
untershceidlichen Konf igurationen abgelegt sein, die auf Si- 
gnale aus den Zellen oder auf externe Signale hin aktivierbar 
sind. Dabei mufi nicht fur alle Konf igurationen ein fester, 

20 unveranderlicher Speicher vorgesehen sein, sondern es kann 

auch. in bestimmten Fallen ein (gegebenenfalls vergleichsweise 
kleiner) Speicher vorgesehen werden. Dies erlaubt demanch ei- 
nen Zell- bzw- Speichermix. 

25 Wahrend in bisherigen Architekturen der Konf igurationsspei- 
cher veranderlich war, und etwa von einer zentralen 
Konfigurationseinheit angesprochen wurde, ist im vorliegenden 
Fall der Konf igurationsspeicher 2h nicht fluchtig gebildet und 
sein Inhalt bei der Herstellung des die Elemente enthaltenden 

30 ICs festgelegt. 

Dies geschieht wie folgt: 
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Zunachst wird festgelegt, welche Anzahl an Zellen und gegebe- 
nenfalls welche Zellen fur die erwartete und mit der 
Datenverarbeitungsanordnung 1 abzuarbeitende Aufgabe erfor- 
5 derlich sind. Dann werden mit diesen die Funktion simuliert. 
Das kann uber Emulatoren geschehen oder es kann ein Feld 
lauf zeitrekonfigurierbaren Elemente mit zentraler Konfigura- 
tionseinheit zur Funktionsentwicklung bzw. zum Funktionstest 
herangezogen werden. Sobald die Funktionsentwicklung abge- 

10 schlossen ist und die erf orderlichen Konfigurationen 

festgelegt sind, wird ein Chip entworfen, der in seinem gro- 
ben Aufbau einer Vielzahl anderer, gleichartiger Chips 
entspricht und sich lediglich hinsichtlich der nichtf luchti- 
gen Konf igurationsspeicherinhalten von jenen unterscheidet . 

15 Es wird dann festgelegt, ob die nichtf luchtigen Konfigurati- 
onsspeicherinhalte mit dedizierten Metall-Lagen festgelegt 
werden und/oder durch Brennen/Schmelzen bestimmter, zur Kon- 
figuration vorgesehener Fuses/Antifuses oder auf andere 
Weise. Die Speicherinhalte werden dann wahrend der Herstel- 

20 lung des Prozesses vorgesehn und der Chip ist fur seine 

dedizierte Aufgabe ohne eine Vielzahl teurer Masken verwend- 
bar. Dabei sind zB regionale Anpassungen moglich, zB, urn 
unterschiedliche Modems etc. zu implement ieren. 

25 In einem weiteren Aspekt der Erfindung befafit sich diesfe mit 
der integrierten elektronischen Verarbeitung von Informatio- 
nen f die in Form analoger Signale vorliegen. Dabei ist 
besonders hervorzuhebeh f dafi etwa die analoge Verarbeitung, 
wie ersichtlich sein wird, auf fest vorgespeicherte Konfigu- 

30 rationen zuriickgr'eifen kann r dafi dafur aus unterschiedlichen 
Konfigurationen auswahlbar ist und dafi etwa bestimmte Zell- 
formen gleichfalis vorteilhaft sind. Fur die integrierte 
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elektronische Verarbeitung von Inf ormationen, die in Form 
analoger Signale vorliegen, existieren gegenwartig mehrere 
Konzepte: 

5 - Diskrete analoge, nicht programmierbare Bausteine, wie etwa 
Transistoren und Operationsverstarker; 

- Analoge, programmierbare, integrierte Schaltkreise, genannt 
FPAAs (Field Programmable Analog Arrays), FPMAs (Field Pro- 

10 grammable Mixed-Signal Arrays) oder FPADs (Field Programmable 
Analog Devices) . .FPAAs, FPMAs und FPADs bestehen ahnlich wie 
die digitalen FPGAs (Field Programmable Gate Arrays) aus ein- 
zelnen, programmierbaren Zellen. Im Fall von FPAAs, FPMAs und 
FPADs ist das Kernstuck einer solchen Zelle ein analoger 

15 Operationsverstarker, dem eine bestimmte Funktion aus einem 
Satz moglicher Funktionen zugewiesen werden kann. Mogliche 
Funktionen sind zum Beispiel Addierer, Inverter, Gleichrich- 
ter und Filter erster Ordnung, mit denen ein analoges Signal 
bearbeitet werden kann. Die Zellen stehen untereinander durch 

20 ein Bussystem in Verbindung und werden durch logische Elemen- 
te gesteuert; 

- Anwendungsspezifische, nicht programmierbare integrierte 
Schaltkreise, 

25 genannt ASICs (Application Specific Integrated. Circuits) ; 

- Programmierbare, voll digitale Prozessoren, genannt DSPs 
(Digital Signal Processors) oder CPUs (Central Processing 
Units), die der digitalen Verarbeitung analoger Signale. nach 

30 deren vorhergehender Arialog-Digital-Wandluhg dienen. Wenn 
nach der Verarbeitung wieder ein analoges Signal vorliegen 
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soil, muss nach der Verarbeitung eine Digital-Analog-Wandlung 
des Signals vorgenommen werden. 

5 Probleme 

Diskrete analoge Baiisteine 

Eine Schaltung mit diskreten Bauelementen kann aufgrund ihrer 
primaren Flexibilitat zwar optimal fur eine bestimmte Aufgabe 
ausgelegt werden. 

10 

Die Aufgaben der Schaltung mussen allerdings zum Zeitpunkt 
des Schaltungsentwurf s genau bekannt sein, denn eine nach- 
tragliche Anpassung der Schaltung an veranderte Anforderungen 
ist nicht oder nur mit erheblichem Aufwand moglich. Dies gilt 
15 insbesondere fur die Programmierbarkeit und fur Umkonfigura- 
tionen im Betrieb. Aufierdem wird eine solche Schaltung bei 
komplexeren Aufgaben schnell umfangreich. 

FPAAs, FPMAs, FPADs 
20 Die durch FPAAs, FPMAs und FPADs gegebenen Moglichkeiten zur 

Verarbeitung analoger Signale orientieren sich am Vorbild 

i . 

klassischer analoger Signalverarbeitungsanlagen. 
Sie sind fiir das zu verarbeitende Signal weitgehend- transpa- 
rent , das heifit, das zu verarbeitende Signal wird bis zu 
• 25 einer bestimmten, bausteinabhangigen Frequenz in Echtzeit be- 
arbeitet. 

Eine einfache Moglichkeit, analoge Werte zu speichern f exi- 
stiert nicht f insbesondere nicht die Moglichkeit f den 
analogen Eingangswert und/oder den Ausgangswert jeder einzel- 
30 nen Zelle zu speichern. Viele wichtige Operationen, wie etwa 
Schleif enberechnungen f und samtliche Prozesse, bei denen meh- 
rere Signale zeitlich koordiniert nacheinander verarbeitet 
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werden, werden durch Speicherung jedoch erst moglich. Eine 
einzelne FPAA-, FPMA- oder FPAD-Zelle kann zwar als Speicher 
nach Art einer Sample-and-Hold-Stuf e konf iguriert werden. Sie 
kann dann jedoch keine zusatzliche Funktion mehr austiben. 

5 

FPAAs, FPMAs und FPADs sind aufgrund ihrer ausschliefilich 
analogen Signalverarbeitung funktionellen Einschrankungen un- 
terworfen. Die Fahigkeiten der in FPAAs , FPMAs und FPADs 
implementierten digitalen Logik beschranken sich auf die 

10 Funktionen, die fur die Umkonf iguration der Zellen notwendig 
sind. Die Funktion der Zellen, die diese wahrend des Betriebs 
austiben, wird durch die Logik im Stand der Technik nicht un- 
terstutzt, geschweige denn erweitert, etwa durch digitale 
Zahlfunktionen oder logische Grundfunktionen wie beispiels- 

15 weise NAND und NOR. Insbesondere gibt es keine jeweils zu 
einer einzigen Zelle gehorenden logischen Strukturen, die 
solche digitalen Zahlfunktionen oder logischen Grundfunktio- 
nen durchfiihren konnen. Dafi hier erf indungsgemafi Abhilfe 
geschaf fen -wird, sei im Vorgriff erwahnt.. Mit FPAAs, FPMAs 

20 und FPADs sind deshalb logische Funktionen wie zum Beispiel 
eingangssignalabhangige Entscheidungen, wenn Oberhaupt, nur 
in geringem Mafie oder nur sehr aufwendig moglich. 

Dasselbe gilt far die datenabhangige Rekonfiguration von 
25 FPAAs, FPMAs und FPADs , beispielsweise (aber nicht nur) nach 
Art einer IF-THEN-ELSE-Anweisung . Diese wird erf indungsgemafi 
ermoglicht. Soli eine EPAA-, FPMA- oder FPAD-Zelle aufgrund 
von Kriterien, die die zu verarbeitenden oder bereits verar- 
beiteten Analogsignale betreffen> rekonf iguriert werden, so 
30 mufi das betrof f ene Analogsignal iiber eine temporare oder so- 
gar permanent e Verbindung nach aufien zu einer externen, nicht 
in dem FPAA, FPMA oder FPAD enthaltenen Struktur gef uhrt 
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werden, welche uber eine etwaige Rekonf iguration entscheiden 
und diese Rekonf iguration auslosen und durchfiihren mufi. Es 
besteht fur die Zelle keine MQglichkeit, abhangig von einem 
Analog- oder Digitalsignal selbstandig, das heiflt mit ihr ei- 
5 genen Strukturen, liber eine Rekonf iguration ihrer selbst zu 
entscheiden, diese Rekonf iguration zu veranlassen und die da- 
zu notwendigen Daten von einer internen, auf dem Baustein 
enthaltenen, dafiir geeigneten Struktur zu erhalten. 

10 Will man das Ergebnis der Operation einer Zelle auf deren 
Eingang ftihren, zum Beispiel bei Schieif enoperationen, so 
kann das bei FPAAs, FPMAs und FPADs nur mittels des Busses 
geschehen; eine eigene Leitung zur Ruckfuhrung des Operati- 
onsergebnisses auf den Eingang der Zelle zur Entlastung des 

15 Busses ist bei FPAAs, FPMAs und FPADs nicht vorgesehen. 

Die genannten Nachteile schlielien es aus, mit FPAAs f FPMAs 
und/oder FPADs ein analoges Rechenwerk aufzubauen, das die 
Flexibilitat und den Funktipnsumfang heutiger digitaler Re- 
20 chenwerke erreicht. 

ASICs 

ASICs besitzen eine hohe primare Flexibilitat, da sie fur ei- 
ne spezielle Anwendung entwickelt werden. Sie eignen sich 

25 jedoch nur fxir diejenige Anwendung, fur die sie entwickelt 

werden; rekonf igurierbar sind ASICs nur in demjenigen Rahmen, 
den die Anwendung vorgibt. andert sich die Anwendung urn ein 
Detail, welches bei der Entwicklung des ASICs nicht beruck- 
sichtigt wurde, so mufi im Extremfall ein neuer ASIC 

30 entwickelt werden. 

. DSPs und CPUs 
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Unter alien Moglichkeiten zur Signalverarbeitung konnen DSPs 
und CPUs zwar am flexibelsten konf iguriert und rekonf iguriert 
werden, allerdings weder teilweise, noch wahrend der Lauf- 
zeit . 

5 

Um Analogsignale in 'ein fur DSPs oder CPUs geeignetes Format 
umzuwandeln, mussen die analogen Signale digital kodiert wer- 
den. Dies erfordert eine Analog-Digital-Wandlung, die 
bei hoheren Anf orderungen an die Prazision recht aufwendig 

10 und teuer werden und iiberdies noch die Bandbreite beschranken 
kann. Entsprechendes gilt fur die Riicktransformation der di- 
gitalen, verarbeiteten Daten in Analogsignale. Um 
ausreichende Schnelligkeit zu erzielen, mussen die internen 
Bussysteme in DSPs und CPUs die einzelnen Bits eines digital 

15 kodierten Analogsignals parallel ubertragen. Die erforderli- 
che Breite des Datenbussystems wachst mit der geforderten 
Prazision der digitalen Kodierung des Signals. Im Gegensatz 
dazu gentigt bei einer analogen (Jbertragung eine Leitung pro 
ubertragenem Analogsignale 

20 

DSPs und CPUs besitzen iiberdies keine zellartige Struktur, 
sondern sind in der klassischen von-Neumann-Architektur auf- 
gebaut. Ihre Modularitat ist deshalb nur gering, 

25 Die heute exististierenden analogen Rechenwerke erreichen bei 
weitem nicht den Funktionsiomfang und die Konfigurierbarkeit 
heute existierender digitaler Rechenwerke. 

Umgekehrt werden analoge Schaltungen zunehmend durch digitale 
Rechenwerke ersetzt f etwa im Fall der DSPs, wobei man die bei 
30 den DSPs genannten Nachteile in Kauf zu nehmen hat; 

Die heute existierenden Methoden zur Verarbeitung analoger 
Signale haben zum Ziel,. diese analogen Daten zu modif izieren. 
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Sind die dazu verwendeten Bausteine konf igurierbar, dann wird 
die Art und Weise, wie die analogen Signale zu modifizieren 
sind, ausschliefilich durch digitale Logik eingestellt, das 
heiflt, die Steuerung erfolgt ausschlielilich durch digitale 
5 Signale. Es existieren weder Moglichkeiten, die Datenverar- 
beitungssteuerung urimittelbar durch analoge Signale 
vorzunehmen, noch Moglichkeiten, analoge Signale mit dem 
Funktionsumfang eines digitalen Rechenwerks zu bearbeiten. 

10 Die Erfindung umfaJit somit auch ein programmierbares, zumin- 
dest teilweise analoges Rechenwerk (Reconf igurable Analog 
Processor, RAP) mit durch logische Elemente erweiterten Funk- 
tionen, in der Weise, dafi der Funktionsumfang eines digitalen 
Rechenwerks verbunden wird mit der Moglichkeit zur schnel- 

15 len, analogen Berechnung komplexer Funktionen (etwa der 

Logarithmusfunktion) und der Rekonf igurierbarkeit eines DFPs 
wie zb gemafi Of f enlegungsschrift DE4416881A1. 

Ein RAP besteht aus Zellen, die in ihrer Funktion und Vernet- 
20 zung frei konf igurierbar und wahrend der Laufzeit 

rekonf igurierbar sind, Bei der Rekonf iguration einer einzel- 
nen Zelle wahrend der Laufzeit werden andere Zellen nicht in 
ihrer Arbeit beeintrachtigt . Eine Zelle ist unterteilt in ei- 
ne Analogsektion und eine Logiksektion. Die Analogsektion 
25 dient der Verarbeitung analoger Daten auf der Basis von Ope- 
rationsverstarkerschaltungen, wie sie von FPAAs, FPMAs und 
FPADs her bekannt sind. Die Logiksektion steuert die Funktio- 
nen der Analogsektion wahrend der Laufzeit, bei der 
Anfangskonfiguration und bei der Umkonf iguration wahrend der 
30 Laufzeit . 
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Die Analogsektion kann aber auch analog gesteuert und konfi- 
guriert werden. Die Datenverarbeitung findet wie bei FPAAs, 
FPMAs und FPADs in erster Linie analog statt; der Funktion- 
sumfang wird jedoch durch besondere Strukturen mit jeweils 
5 einer Logiksektion und verschiedenen Speichern in jeder Zelle 
dahingehend erweiteft, daJi in der Zelle eingangsdatenabhangi- 
ge logische Operationen, Vergleiche, Schleifenoperationen und 
Zahlvorgange schnell und einfach durchgefiihrt werden konnen, 
so dafi ein Funktionsumf ang ahrilich dem eines voll digitalen 
10 Rechenwerks erreicht wird, 

Es besteht fur jede RAP-Zelle zur Vereinf achung ihrer Rekon- 
figuration die Moglichkeit, abhangig von eineni Analog- oder 
Digitalsignal selbstandig, das heifit mit ihr eigenen, inter- 
15 nen Strukturen, tiber eine Rekonf iguration ihrer selbst zu 

entscheiden, diese Rekonfiguration zu veranlassen und die da- 
zu notwendigen Daten von einer dafur geeigrieten Struktur zu 
erhalten. 

20 Zwei unabhangige, rekonf igurierbare Bus sy s t erne , eines fur 
analoge Signale, das andere fiir digitale Signale, vernetzen 
die Zellen untereinander und mit der Aufienwelt- Jedes analoge 
Signal benotigt zu seiner Obertragung nur eine analoge Bus- 
leitung. Bei eihem digitalen Bus wachdt die Zahl der 

25 benotigten Leitungen bei paralleler Otjertragung mit der ge- 
fdrderten Prazision der digitalen Codierung des analogen 
Signals stark an. Die notwendige Busbreite eines analogen 
Busses ist deshalb im Vergleich zu der eines digitalen Busses 
bei vergleichbarer Signalauf losurig und Obertragungsrate ganz 

30 wesentlich verringert. Es sei erwahnt, dass auf einem inte- 
grierten Schaltkreis Mischungen vorliegen konnen aus analogen 
und digitalen Schaltkreisen; dabei kann eine weitgehende 
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Trennung und/oder Ubergangsbeschaltung z. B. in Form von DACs 
und/oder ACDs zwischen analogen und digitalen Elementen vor- 
gesehen werden. Die digitalen' Element e konnen ihrerseits 
durch PAEs, RAM-PAEs usw. insbesondere mit geeignetem Aspekt- 
5 verhalten gebildet sein. 

Die Erfindung beschreibt in diesem Teilaspekt sonst u.a. ein 
analoges, umkonf igurierbares Rechenwerk (Reconfigurable Ana- 
log Processor/ RAP) aus einzelnen funktionalen Zellen, die 

10 durch ein geeignetes Bussystem untereinander und mit der Au- 
fienwelt verbunden sind. Die Funktion der Zellen ist 
konfigurierbar und kann wahrend des Betriebs so rekonfigu- 
rierbar sein, dafi dabei die Funktion anderer, nicht zu 
rekonf igurierender Zellen nicht beeintrachtigt wird. Eine 

15 funktionale Zelle enthalt eine Analogsektion und eine Logik- 
sektion. Die Analogsektion dient der Verarbeitung analoger 
Daten auf der Basis von Operationsverstarkerschaltungen. Die 
Logiksektion steuert die Funktionen der Analogsektion wahrend 
der Lauf zeit, bei der Anfangskonf iguration und bei der Omkon- . 

20 figuration wahrend der Laufzeit. Auflerdem erweitert die ' 

Logiksektion die rein analogen Funktionen der Analogsektion 
durch die Bereitstellung von zb Logikfunktionen und/oder di- 
' gitalen Zahlfunktionen und/oder arithmetishcen und/oder 

Speicherelementen. Jeder Zelle konnen ein oder mehrere analo- 

25 ge Speicher zugeordnet sein, die analoge Grofien wie 

beispielsweise Eingangs- oder Ausgangssignale speichern und 
zur weiteren Verarbeitung bereitstellen konnen. Aufierdem ge- 
horen zu jeder Zelle ein oder mehrere digitale Register zur 
Speicherung von digitalen Daten f die fur die. Kpnf iguration 

30 und den Betrieb der Zelle notwendig sind. 
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Fur jede Zelle besteht die Moglichkeit, abhangig von einem 
Analog- oder Digitalsignal selbstandig, das heifit mit ihr ei- 
genen internen Strukturen, uber eine Rekonf iguration ihrer 
selbst gegebenenfalls zu Gruppen zusammengefafJter Zellen oder 
5 anderer Zellen zu entscheiden, diese Rekonf iguration zu ver- 
anlassen und die dazu notwendigen Daten von einer dafur 
geeigneten Struktur, welche sich auf dem Baustein befinden 
kann, zu erhalten. Es existiert weiterhin die Moglichkeit , 
das analoge Ergebnis der Operation einer Zelle ohne Zugriff 
10 auf ein Bussystem auf den analogen Dateneingang der Zelle zu- 
riickzufuhren. 

In diesem Abschnitt werden Begriffe verwendet, deren Bedeu- 
tung von der allgemein gebrauchlichen in manchen Punkten 
15 abweichen kann. Zum besseren Verstandnis folgen die Begriffs- 
definitionen, wie sie in diesem Abschnitt verwendet werden. 

Ein Signal soil hier definiert sein als eine Groiie, bei- 
spielsweise eine Spannung U_0 (t) , die zu einem bestiramten 

20 Zeitpunkt an einem bestimmten Punkt einer Schaltung herrscht. 
Ein solcher Punkt kann beispielsweise ein Ausgang, ein Ein- 
gang oder eine Busleitung sein. Die Spannung U_0(t). kann 
entweder auf Masse (GND) oder auf eine zweite Spannung U_l(t) 
bezogen sein. Das Signal kann zeitlich konstant oder zeitlich 

25 veranderlich sein. 

Information soil .hier definiert sein als Anzahl der mogli- 
chen, unterscheidbaren Zustande f die ein Signal annehmen 
kann . 

30 

Als digitales Signal oder Digitalsignal soil hier ein Signal 
dann bezeichnet werden, wenn es nur zwei Zustande, beispiels- 
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weise 0 oder 1, annehmen kann, also nur zwei Inf ormationen im 
Sinne der hier verwendeten Definition der Information bein- 
haltet. 

5 Als analoges Signal oder Analogsignal soil hier ein Signal 
dann bezeichnet werd'en, wenn es mindestens drei und hSchstens 
abzahlbar unendlich viele Zustande annehmen kann, also mehr 
als zwei Inf ormationen im Sinne der hier verwendeten Defini- 
tion der Information beinhaltet. Das bedeutet insbesondere, 
10 dafi mittels analogen Signalen immer mehr Inf ormationen 

gleichzeitig uber eine Leitung ubertragen werden konnen als 
mit digitalen Signalen. 

Im folgenden wird der Aufbau einer erf indungsgemafien funktio- 
15 nalen Zelle und der Aufbau des zugehorigen, die Zellen 
vernetzenden Bussystems beschrieben. 

Die Zelle 

20 Eine Zelle stellt die kleinste vollstandige, selbstandige 

funktionale Einheit eines RAPs dar. Dabei sind zwei verschie- 
dene Typen von Zellen m5glich — die einfache Zelle und "die 
erweiterte Zelle. Beide Zelltypen konnen auf einem RAP zum 
Einsatz kommen. Sie unterscheiden sich im Funktionsumf ang . 

25 Beiden Zelltypen gemeinsam ist die Unterteilung ihrer Struk- 
tur in eine Analogsektion und eine Logiksektibn. 

Einige oder alle Zellen konnen einen. Taktvervielfacher zur 
Erzeugung eines lokalen, auf die Zelle beschrankten hQheren 
30 Taktes beinhalten, der beispielsweise die Zahlfunktionen der 
Logiksektion der Zelle unterstutzt. Denkbar ist auch, dafi ei- 
nige oder alle Zellen Strukturen zur Erzeugung eines 
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zellinternen oder lokal begrenzten Zelltakts beinhalten kon- 
nen, dessen Frequenz unabhangig von der Frequenz eines 
etwaigen Bustakts konfiguriert werden kann. Der Zelltakt kann 
aktivierbar und deaktivierbar sein. 

5 

Die einfache Zelle (SCELL) 

Die Elemente der einfachen Zelle (SCELL) gliedern sich in 
. 10 zwei Gruppen, genannt Analogsektion und Logiksektion. Die 

Analogsektion dient der analogen Datenverarbeitung der analo- 
gen Eingangssignale einer Zelle , kann aber auch analoge 
Signale erzeugen, wie beispielsweise (aber nicht nur) ein 
Rechtecksignal oder ein Dreiecksignal. Die Logiksektion 

15 stellt zusatzliche nicht-analoge Funktionen zur Verfiigung, 
insbesondere zB eingangsdatenabhangige logische Operationen, 
Vergleiche und Zahlvorgange, Speicher und/dder arithmetische 
Operationen und steuert dartiberhinaus die Tatigkeit der ge- 
samten SCELL. Ein Element der Logiksektion ist die 

20 Steuerlogik (CL) . Sie steuert die Funktionen der Analogsekti- 
on und verwaltet Signale zur Rekonf iguration der Zelle, die 
uber die Bussysteme erhalten oder abgeschickt werden.. 

Die Analog-Eingangsstufe der SCELL ist ein Multiplexer (MUX0) 
25 nach Sj:and der Technik fur Analogsignale. Das zu verarbeiten- 

de analoge Signal wird von einem analogen Da tenbus system 

(ABUS) auf die Eingange von MUX0 gefiihrt. MUX0 f gesteuert von 

der CL, selektiert das von der SCELL zu verarbeitende Ana- 

logsignal und schaltet es zu der analogen 
30 Verarbeitungseinheit (APU, Analog Processing Unit) durch. Die 

APU ist eine konfigurierbare Einheit nach Stand der Technik. 

Sie enthait. eine oder mehrere Operationsverstarkerschal- 
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tung/en, deren Funktion aus einem Satz moglicher Funktionen 
ausgewahlt werden kann. Die Auswahl der Funktion geschieht 
mittels eines digitalen Signals von der CL. 

5 Funktionen der APU konnen beispielsweise (aber nicht nur) 
sein: 

- Addition einer programmierbaren Grofie zum analogen Ein- 
gangssignal der APU 

10 - Subtraktion einer programmierbaren Grofie vom analogen Ein- 
gangssignal der APU 

- Multiplikation des analogen Eingangssignals der APU iait 
einer prograramierbaren Grofie 

- Division des analogen Eingangssignals der APU durch eine 
15 programmierbare Grofie, Division einer programmierbaren Grofie 

durch das analoge Eingangssignal der APU 

- Logarithmierung des analogen Eingangssignals der APU 

- Antilogarithmierung des analogen Eingangssignals der APU 

- Invertierung des analogen Eingangssignals der APU 

20 - Keine Veranderung des analogen Eingangssignals der APU 

- Filterfunktionen, beispielsweise Hochpasse, Tiefpasse, 
Bandpasse und- Notchfilter 

- Signaler zeugung f beispielsweise Rechtecksignale, Dreiecksi- 
gnale und Sinussignale mit programmierbaren Zeitkonstanten 

25 - Potenzierung 

- -Speicherung 

Das zu verarbeitende analoge Signal wird entsprechend der 
durch die CL programmierten Funktion in der APU verandert 
oder (in der Funktion eines Spannungsfolgers) nicht veran- 
30. dert f oder die APU dient der Erzeugung eines neuen analogen 
Signals. Denkbar ist insbesondere die Erzeugung eines Si- 
gnals, das eine Rekonfigurationsauf f orderung darstellt, und 
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in dem die notwendigen Rekonf igurationsparameter in analoger 
Form kodiert sind. Der analoge Ausgang der APU ist an eine 
Speicherstufe (BIPS) angeschlbssen. Die BIPS kann sich in 
einem von mehreren durch die CL programmierbaren Zustanden 
5 befinden, beispielsweise in einem der folgenden. 

BUFNONINV: Das Ausgangssignal der BIPS hat denjenigen Wert, 
der an ihrem Eingang lag, als die BIPS ein BUFFER-Signal von 
der CL erhielt. Der Ausgangswert wird konstant gehalten, so- 
10 lange das BUFFER-Signal anliegt. 

BUFINV: Das Ausgangssignal der BIPS hat denjenigen invertier- 
ten Wert, der an ihrem Eingang lag, als, die BIPS ein BUFFER- 
Signal von der CL erhielt. Der Ausgangswert wird konstant ge- 
15 halten, solange das BUFFER-Signal anliegt. 

INVERT: Das Eingangssignal der BIPS wird invertiert. 

PASS: Die BIPS schleift das Eingangssignal unverandert durch. 

20 

3 STATE: Der Ausgang der BIPS nimmt einen hochohmigen Zustand 
ein. 

Der Ausgang der BIPS ist mit dem Eingang eines analogen De- 
25 multiplexers (DeMUX) verbunden, dessen Ausgange mit den 

Busleitungen des ABUS verbiinden sind. Ober die CL wird ge- 
steuert, auf welchen Ausgang des DeMUX das verarbeitete 
analoge Signal gefiihrt wird. 

30 Als zusatzliches Element der Logikse.ktion einer SCELL zur Er- 
weiterung des Funktionsumfanges der SCELL existiert die 
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LOGUNIT. Sie ist in der Lage, beispielsweise folgende Funk- 
tioneri durchzufiihren: 

- digitale Zahler, die von der CL und/oder der APU gesetzt, 

5 getriggert, abgefragt ruckgesetzt und angehalten werden kon- 
nen; diese konnen als grobgranulare Logikelemente gebildet 
sein; andere grobgranulare Logik- und/oder Funktionselemente 
wie arithmetische, insbesondere ALUartige und/oder speichern- 
de Elemente sind gleichfalls implementierbar . 

10 

- logische' Grundfunktionen, wie NAND, NOR, AND, OR, XOR, 
INVERT, BUFFER, die aus der* CL und/oder APU stammende Infor- 
mationen logisch miteinander verknupfen konnen. Hier handeit 
es sich also um f eingranulare Logikelemente. Solche Informa- 

15 tionen konnen abhangig vom Status der CL und/oder der APU 
sein, und/oder von zu verarbeitenden Signalen. Insbesondere 
konnen solche Inf ormationen Kriterien sein, die auch zur Bil- 
dung eines RECONREQ-Signals (Rekonfiguration-Request) fiihren. 

20 

Die erweiterte Zelle (ECELL) 

Die erweiterte Zelle (ECELL) enthalt in einer bevorzugten 
Ausfuhrungsform eine vollstandige, voll funktionale SCELL, 
25 die um zusatzliche Elemente und Funktionen erweitert wurde, 
um insbesondere (aber nicht nur) Schleifenoperationen ohne 
Zugriff auf das Bussystem. durchfuhren zu konnen ^ 

Die analoge Eingangsstuf e (MUX0) ist um einen zweiten, 
30 gleichwertigen, auf den ABUS zugreifenden analogen Multiple- 
xer (MUX1) erweitert. Mit MUX0 und MUX1 ist es moglich, statt 
(wie bei einer SCELL) nur. einem Eingangssignal zwei Eingangs- 
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signale zur anschlieJJenden Verarbeitung in der Zelle freizu- 
geben. Aufier den Busanschliissen besitzen MUXO und MUX1 
jeweils zusatzlich noch einen* Eingang, derauf Masse gelegt 
ist und einen Eingang, auf den das Ergebnissignal vom Aus- 
5 gang der BIPS der ECELL zuruckgefiihrt wird. Der Ausgang von 
MUXO fiihrt das von MUXO zur Verarbeitung selektierte Ana- 
logsignal, welches ausdrucklich auch der konstante 
Massepegel oder das Ergebnissignal vom Ausgang der BIPS der 
ECELL sei kann. Der Ausgang von MUX1 fiihrt das von MUX1 zur 
10 Verarbeitung selektierte Analogsignal, welches ebenfalls auch 
der konstante Massepegel oder das Ergebnissignal vom Aus.gang 
der BIPS der ECELL sei kann. 

Die Ausgangssignale von MUXO und MUX1 werden auf die folgen- 
15 den, programmierbaren Speicherstufen (BUFFO, BUFFI) gefuhrt. 
BUFFO erhalt das Ausgangssignal von MUXO, BUFFI erhalt das 
Ausgangssignal von MUXl. BUFFO und BUFFI sind durch die CL 
konfigurierbare Einheiten, deren Funktion aus einem Satz 
moglicher Funktionen ausgewahlt werden kann. Mogliche Funk- 
20 tionen von BUFFO und BUFFI sind beispielsweise 

BUFNONINV: Der Wert des Ausgangs signals von BUFFO bzw. BUFFI 
ist gleich demjenigen analogen Eingangssignal, das anlag, als 
BUFFO bzw. BUFFI ein BUFFER-Signal von der CL erhielt. Der 
25 Ausgangswert wird konstant gehalten, solange das BUFFER- 
Signal ariliegt. 

BUFINV: Der Wert des Ausgangssignals von BUFFO bzw. BUFFI ist 
gleich demjenigen analogen Eingangssignal, das anlag, als 
3.0 BUFFO bzw. BUFFI ein BUFFER-Signal von der CL 

erhielt. Der Ausgangswert wird konstant gehalten, solange das 
BUFFER-Signal anliegt. 
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INVERT: Das aktuelle analoge Eingangssignal von BUFFO bzw. 
BUFFI wird invertiert. 

5 PASS: BUFFO bzw, BUFFI schleift das aktuelle Eingangssignal 
unverandert durch. 

Das Ausgangssignal von BUFFO und das Ausgangssignal von BUFFI 
werden auf jeweils einen analogen Eingang der erweiterten 
10 .analogen Verarbeitungseinheit XAPU der ECELL gefiihrt. Alle 
Funktionen der APU einer SCELL sind in der XAPU einer ECELL 
enthalten. 

Im Gegensatz. zur APU der SCELL besitzt die XAPU zwei analoge 
Eingange, so dali in der XAPU Operationen mit zwei analogen, 

15 zeitlich konstanten oder zeitlich veranderlichen Signalen 

moglich sind, insbesondere die Addition, Subtraktion, Multi- 
plikation und Division zweier solcher Signale. Es ist damit 
denkbar, die XAPU mittels eines analogen, zeitlich konstanten 
oder zeitlich veranderlichen Steuersignals zu programmieren, 

20 indem bestimmten Werten des Steuersignals bestimmte Funktio- 
nen zugewiesen werden. Dariiberhinaus ist es denkbar, mit 
I 

einem analogen St euer signal der APU einen zur Ausiibung einer 
Funktion notwendigen Parameter zu ubermitteln. Wenn bei- 
spielsweise f (t) ein analoges zeitlich veranderliches 

'25 (Spannungs-) Signal ist, welches mit einem zeitlich verander- 
lichen (Spannungs-) Signal g(t) multipliziert werden soli, 
kann die XAPU dann als Multiplikator nach Art eines span- 
nungsgesteuerten Verstarkers (Voltage Controlled Amplifier, 
VCA) nach Stand der Technik programitiiert werden, wobei f (t) 

30 an einem analogen Eingang der XAPU liegt, wahrend g(t) am an- 
deren analogen Eingang der XAPU liegt und das besagte 
Steuersignal darstellt. 
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Das Ausgangssignal der XAPU wird auf den Eingang der BIPS ge- 
fuhrt. Die BIPS der ECELL und* die BIPS der SCELL konnen 
gleich sein. Das Ausgangssignal der BIPS wird auf den Eingang 
5 des DeMUX gefuhrt. Der DeMUX der ECELL und der DeMUX der 
SCELL konnen gleich "sein. Aufierdem wird das Ausgangssignal 
der BIPS tiber eine separate Leitung auf einen Eingang von 
MUXO sowie auf einen Eingang von MUX1 gefuhrt. 

10 Die Logiksektion kann ein Element zur Taktvervielf achung ent- 
halten,- welches den Takt des DBUS vervielfacht, und das 
programmierbar sein kann. Damit kann die ECELL intern mit ei- 
nem Vielfachen des DBUS-Taktes operieren. 

15 Rekonfiguration einer Zelle (cellreconfig) 

Das RECONREQ-Signal 

Die Analogsektion und die Logiksektion der Zelle sind bevor- 
zugt in der Weise strukturiert und verbunden, dafi die Zelle 

20 bei Eintreten bestimmter Kriterien ein Signal, das RECONREQ- 
Signal , erzeugen kann, mit welchem sie ihre eigene Rekonfigu- 
ration oder die Rekonfiguration einer anderen oder mehrerer 
anderer Zellen veranlassen kann. Das RECONREQ-Signal kann di- 
gital sein und uber ein separates digitales Bussystem 

25 weitergeleitet werden. Es kann aber auch analog sein und tiber 
ein separates analoges Bussystem weitergeleitet werden. 
Mit einem analogen . RECONREQ-Signal ist es moglich, neben den 
RECONREQ-Informationen noch zusatzliche Informationen, zuiti 
Beispiel die Adresse der zu. rekonf igurierenden Zelle oder der 

30 zu rekonfigurierenden Zellen, gleichzeitig auf nur einer 
Busleitung zu Obertragen. 
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Kriterien, die ein RECONREQ-Signal auslosen, konnen zum Bei- 
spiel (aber nicht nur) sein: 

- Ein bestimmter Signalpegel, der von in der Zelle auftreten- 
5 den Analogsignalen (zu denen auch die analogen Eingangs- und 

Ausgangssignale zahlen) erreicht, uberschritten oder unter- 
schritten wird. 

- Eine bestimmte Signaldif f erenz, die zwischen in der Zelle 
10 auftretenden Analogsignalen (zu denen auch die analogen Ein- 
gangs- und Ausgangssignale zahlen) , erreicht, uberschritten 
oder unterschritten wird. 

- Eine bestimmte zeitliche Anderung eines Signalpegels, die 
15 von in der Zelle auftretenden Analogsignalen (zu denen auch 

die analogen Eingangs- und Ausgangssignale zahlen) erreicht , 

r * 

uberschritten oder unterschritten wird. 

- Das Verstreichen einer bestimmten Zeitspanne. 

20 

i 

- Das Auftreten eines bestimmten digitalen Signals oder einer 
bestimmten Kombination digitaler Signale in 'der Zelle oder an 
den digitalen Eingangen und/oder Ausgangen der Zelle. 

25 Die in der obitjen Auflistung genannten Signale konnen aus- 

drUcklich auch von anderen Zellen oder weiteren Elementen des 
RAPs stammen. Aulierdem konnen durch logische Verkhupfung 
(AND, 0R f NAND f NOR, XOR usw.) der genannten Kriterien weite- 
re Kriterien gebildet werden. Die Logiksektion der ECELL 

30 enthalt zur logischen Verknupfung von Kriterien geeignete 
Strukturen, zB fur Ergebnisvergleich, Flags einer ALU wie 
Obertrag einer arithmetischen Einheit (carry etc) 



- 26 - 



WO 2004/021176 



PCT/EP2003/008081 



Die Kriterien zur Bildung eines RECONREQ-Signals werden in 
der CL der Zelle ausgewertet. Die CL der Zelle generiert aus 
diesen Kriterien ein digitales Wort ( RECONREQ-Wort ) mit den 
5 notigen RECONREQ-Inf ormationen. 

Dieses RECONREQ-Wort kann in digitaler oder analoger Form von 
der Zelle weitergegeben werden. Dafiir stehen eigene Bussyste- 
me (RECONREQ-Bus) , ein digitaler Bus und ein analoger Bus, 
zur Verfugung, 

10 

Soli das RECONREQ-Wort in- analoger Form weitergegeben werden, 
so wird das digitale RECONREQ-Wort in einem Digital-Analog- 
Umsetzer (DAC) in analoge Form gebracht. Jede Zelle kann zu 
diesem Zweck einen solchen DAC besitzen. 

15 

Die Daten, die zur Rekonf igurierung der Zelle notwendig sind, 
stellen eine dafiir geeignete Struktur zur Verfiigung. Diese 
Struktur kann beispielsweise eine Ladelogik und eine Swit- 
ching-Tabelle sein, wie sie in Patentanmeldung DE196 54 
20 846.2 beschrieben sind. 

Die Ladelogik 

Die Ladelogik (LL) ist £ine Struktur, die nach einem 
25 RECONREQ- S i gna 1 die Rekonf iguration der betreffenden Zelle 
oder der betreffenden Zellen durchfuhrt. Mehrere Zellen ste- 
hen mit jeweils einer einzigen LL iiber den RECONREQ-Bus in 
Verbindung. Diese Zellen bilden mit der zugehorigen LL einen. 
Cluster. Jede Zelle eines Clusters kann ein RECONREQ- Signal 
30 . an ihre LL absetzen und so jede Zelle desselben Clusters zur 
Rekonf iguration auffordern. Andere Moglichkeiten, eine Rekon- 
f iguration anderer Zellen auszulosen, bestehen gleichfalls. 
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Verwiesen wird auf die o.g. Schriften und weitere Schriften 
der vorliegenden Anmelderin. Ein Baustein kann mehrere Clu- 
ster enthalten. Die LLs diesef Cluster stehen untereinander 
uber ein Bussystem in Verbindung und konnen somit Inf ormatio- 
5 nen austauschen. Solche Inf ormationen konnen insbesondere 

Adressen von umzukonf igurierenden Zellen sein. Dadurch ist es 
jeder beliebigen Zelle des RAPs moglich, jede beliebige Zelle 
des RAPs zur Rekonf iguration auf zuf ordern. 

10 Die LL kann entsprechend PACTJSWT (vergl. zitierte Patentan- 
meldung) aufgebaut sein und kann damit digitale RECONREQ- 
Worte direkt verarbeiten. Die LL benotigt fiir die Verarbei- 
tung eines analogen RECONREQ-Wortes jedoch analoge 
Vorstufen, namlich eine analoge Selektierstuf e (ASELSTAGE) 

15 und eine Analog-Digital-Wandlerstuf e (ADC) . Die Aufgabe der 
ASELSTAGE ist es, zu prttfen, ob und an welchem analogen 
RE CONREQ- Bus ein RECONREQ- Signal anliegt. 1st ein RECONREQ- 
Signal auf einem analogen RECONREQ-Bus vorhanden, so wird 
dieser Bus von der ASELSTAGE selektiert urid zur weiteren 

20 Verarbeitung auf den ADC geschaltet, welcher das analoge 

RECONREQ-Wort in ein digitales RECONREQ-Wort zurtickwandelt, 
das von der LL verarbeitet werden kann. 

Die ASELSTAGE kann auf verschiedqne Arten realisiert werden. 
25\ Eine Moglichkeit ist die Verwendung. eines Multiplexers, eine 
andere die Vferwendung eines Arbiters. 

ASELSTAGE als Multiplexer. Die analogen RECONREQ-Bus se der 
von der LL uberwachten Zellen liegen an den Eingangen eines 
30 getakteten Analogmultiplexers nach Stand der Technik. Bei je- 
dem Takt wird der Multiplexer urn einen Eingang 
weitergeschaltet, so dafi bei jedem Takt ein anderer Bus am 
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Ausgang des Multiplexers liegt. Ein Komparator iiberwacht den 
Ausgang des Multiplexers. Wenn kein analoges RECONREQ-Signal 
am Ausgang des Multiplexers liegt, hat der Ausgang des Multi- 
plexers einen bestimmten Pegel, beispielsweise 0 Volt. Liegt 
5 ein RECONREQ-Signal an, liegt ein anderer Pegel am Ausgang 
des Multiplexers, was den Komparator dazu veranlallt, das 
RECONREQ-Signal auf den nachf olgenden ADC zu schalten. Al- 
ternativ und/oder zusatzlich konnen mehrere Komparatoren 
vorgesehen sein, die das Signal mit unterschiedlichen Si- 
10 gnalpegeln vergleichen und so unmittelbar eine Auswertung 
bewirken. Dies bietet sich insbesondere an, . wenn .nur ..wenige 
Signalstufen zu unterscheiden sind. 

ASELSTAGE als Arbiter. Die analogen RECONREQ-Busse der Zellen 
15 eines Clusters werden zunachst auf die Eingange eines analo- 
gen Multiplexers (AMUX) gefuhrt. Liegt an einem der analogen 
RECONREQ-Busse ein RECONREQ-Signal an, so wird dieser Bus 
durch den AMUX selektier und das anliegende RECONREQ-Wort auf 
den Ausgang des AMUX geschaltet. 

20 

Bus syst erne 

Ein RAP enthalt bevorzugt zumindest zwei voneinander unabhan- 
gige, flexible Bussysteme zur Vernetzung der einzelnen Zellen 
und zur Verbindung des RAPs mit der AuJJenwelt. Die bevorzug- 

25 ten Bussysteme konnen konfiguriert und wahrend der Laufzeit 
rekonf iguriert werden, ohne dafi die Tatigkeit des RAP unter- 
brochen werden mufi. Die Bussysteme konnen mit Eigenschaf ten 
ausgestattet sein, wie sie in Patentanmeldung DE 197 04 742.4 
beschrieben sind. Unterschieden wird hier das analoge Bussy- 

30 stem und das digitale Bussystem. 

Das analoge Bussystem (ABUS) 
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Das analoge Bussystem ABUS dient der Obenuittlung der zu be- 
arbeitenden, bereits bearbeiteten oder neu erzeugten analogen 
Daten und analogen Signale von aulien an die Zellen und/oder 
zwischen den Zellen. Insbesondere ist es mit dem ABUS mog- 
5 lich, Zellen zu kaskadieren, urn auf diese Weise ein analoges 
Signal in mehreren aufeinanderfolgenden Operationen zu bear- 
beiten, wobei eine Operation von jeweils einer Zelle 
durchgefuhrt wird. 

Der ABUS kann mit jeder seiner Leitungen mehrere, insbesonde- 
10 re mehr als zwei Informationen gleichzeitig ubertragen, zum 
Beispiel 256 Informationen. ' Der ABUS kann mit einer festen 
oder variablen Frequenz getaktet sein oder asynchron, das 
heiflt nicht getaktet, sein. Die Implement ierung des ABUS kann 
in einer Art und Weise erfolgen, wie sie in Patentanmeldung 
15 DE 197 04 742.4 beschrieben ist. 

Das digitale Bussystem (DBUS) 

Neben dem ABUS existiert auf dem RAP ein zweites Bussystem, 
genannt DBUS. 

20 Der DBUS ist getaktet und dient der Distribution digitaler 
Daten, beispielsweise Konfigurationsdaten und Statusdaten, 
zwischen den Zellen. Die Logiksektion jeder Zelle ist an den 
DBUS angeschlossen. Die Implementierung des DBUS kann in ei- 
ner Art und Weise erfolgen, wie sie in Patentanmeldung 

25 DE 197 04 742.4 beschrieben ist. 

Dieser Aspekt der Erfindung wirdmit Bezug auf die Zeichnung 
nachfolgend besipielhaft erlautert, wobei dargestellt ist 
durch 

30 Figur Bl zeigt den.Aufbau einer einfachen Zelle 
Figur B2 zeigt den Aufbau einer erweiterten Zelle 
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Figur B3 zeigt eine mogliche Art der Realisierung von BUFFO 
bzw. BUFFI 

Figur B4 zeigt, wie beispielsweise der Ausdruck f(t) A g(t) be- 
rechnet werden kann. 

5 

Figur 1 zeigt den Aufbau einer einfachen Zelle (SCELL) .Sie 
besteht aus der Digitalsektion (0101) und der Analogsektion 
(0102) . Zentrales Element der Logiksektion ist die Steuerlo- 
10 gik CL (0110), die iiber den DBUS (0130) mit anderen Zellen, 
zusatzlichen Strukturen . wie beispielsweise einer Ladelogik 
und/oder einer Switching-Tabelle, wie sie in Patentanmeldung 
DE 196 54 846.2 beschrieben sind, und/oder der AuBenwelt kora- 
munizieren kann. 

15 

Der Multiplexer MUX0 (0121) ist an den ABUS (0131) ange- 
schlossen. Sofern ein Analogsignal von der SCELL zu 
verarbeiten ist, selektiert MUX0 (0121), uber die Leitungen 
(0141) von der Steuerlogik CL (0101) oder einer anderen ge- 

20 eigneten Struktur gesteuert, diejenige Leitung des ABUS 

(0131), auf der das zu verarbeitende Analogsignal anliegt. 
Der Ausgang von MUX0 (0121) ist iiber die Leitung 0146 mit 
der analogen Verarbeitungseinheit APU (0120) verbunden. In 
ihr wird das von MUX0 selektierte. Signal verarbeitet, sofern 

25 ein Signal selektiert wurde, oder die APU generiert ein Si- 
gnal, welches ein RECONREQ-Signal sein kann, oder die APU 
verharrt in einem vordefinierteh Ruhezustand. Das Verhalten 
der APU wird von der CL (0101) uber die Leitungen 0143 ge- 
steuert. Diese Leitungen (0143). kQnnen bidirektional 

30 ausgefuhrt sein, so dafi die APU in der Lage ist, abhangig von 
bestimmten Ereignissen und Kriterien Signale an die CL (0101) 
zu schicken. Die Kriterien konnen solche sein, die bei- 
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spielsweise auch zur Erzeugung eines RECONREQ-Signals ftihren. 
Ein erzeugtes Signal kann insbesondere ein RECONREQ-Slgnal, 
wie in Abschnitt cellreconfig' beschrieben, sein. Das von der 
APU verarbeitete oder erzeugte Signal gelangt iiber die Lei- 
5 tung 0149 auf eine Speicherstuf e BIPS (0124), deren Funktion 
von der CL (0101) gesteuert wird. Dabei stehen die in Ab- 
schnitt scell beschriebenen Funktionen BUFNONINV, BUFINV, 
INVERT, PASS, 3 STATE zur Verfugung. Am Ausgang der BIPS wird 
das Analogsignal von einem Demultiplexer DeMUX (0125) iiber- 
10 nommen, der es, gesteuert von der CL iiber Leitung 0145 oder 
einer anderen geeigneten Struktur, auf den ABUS 0131 schal- 
tet . 

Die Logiksektion (0101) der SCELL besteht aus der CL (0110) 
15 und der LOGUNIT (0111), die iiber die Leitung 0140 miteinander 
in Verbindung stehen. 

Figur 2 zeigt den Aufbau einer erweiterten Zelle (ECELL) . 
Sie ist funktionell unterteilt in eine Analogsektion (0202) 

20 und eine Logiksektion (0201) . Die analogen Multiplexer MUX0 
(0221) und MUX1 (0222) selektieren, gesteuert von der CL 
(0210) der ECELL, die beiden Analogsignale, die von der ECELL 
verarbeitet werden sollen. MUX0 selektiert dabei das erste 
Analogsignal, MUX1 selektiert das zweite Analogsignal. Fiir 

25 die Herkunft der beiden zu verarbeitenden Analogsignale gibt 
es drei Moglichkeiten. 

Entwedex stammt das erste und/oder das zweite Analogsignal . 
vom ABUS, oder das erste und/oder das zweite Analogsignal 
sind identisch rait der festen Massebezugsspannung GND, oder 
30 das erste und/oder das zweite Analogsignal sind identisch mit 
dem Ausgangssignal der BIPS (0225), welches mittels der Lei- 
tung 0252 auf jeweils. einen Eingang von MUX0 und MUX1 



- 32 - 



WO 2004/021176 



PCT/EP2003/008081 



zuruckgefiihrt wird. Das erste Analogsignal gelangt von MUXO 
uber die Leitung 0246 auf BUFFO (0223). Das zweite Analogsi- 
gnal gelangt von MUX1 uber die Leitung 0247 auf BUFFI (0224). 
Die beiden Analogsignale konnen in BUFFO bzw. BUFFI gemaJ3 den 
5 in Abschnitt uber die Ecell beschriebenen Betriebsarten von 
BUFFO und BUFFI verandert werden. BUFFO und BUFFI konnen uber 
die Leitung 0242 unabhangig voneinander durch die CL (0210) 
gesteuert werden. Das analoge Ausgangssignal von BUFFO (0223) 
gelangt uber die Leitung 0248 auf den ersten Analogeingang 

10 der XAPU (0220) . Das analoge Ausgangssignal von BUFFI (0224) 
gelangt uber die Leitung 0249 auf den zweiten Analogeingang 
der XAPU (0220) . Die XAPU (0220) verarbeitet die beiden ana- 
logen Eingangssignale zu einem analogen Ausgangssignal gemaB 
der durch die CL (0210) liber die Leitung 0243 programmierten 

15 Funktion, wie in Abschnitt Ecell beschrieben. Das analoge 

Ausgangssignal der XAPU (0220) wird mittels der Leitung 0250 
an eine weitere Speicherstuf e (BIPS, 0225) iibertragen. Die 
BIPS der ECELL und die BIPS der SCELL konnen gleich sein. 
Die Funktion der BIPS (0225) wird von der CL (0210) durch die 

20 Leitung 0244 gesteuert. Das analoge Ausgangssignal der BIPS 
wird durch die Leitung 0251 auf den Demultiplexer (DeMUX, 
0226) ttbertragen, der das Signal auf den ABUS (0231) auf- 
schaltet. Der DeMUX wird von der CL (0210) gesteuert. 

25 Die Logiksektion (0201) der ECELL besteht aus einer vollstan- 
digen Logiksektion, wie sie in einer SCELL zu finden ist, 
also der CL (0210) und der LOGUNIT (0211), die uber die Lei- 
tung (0240.) miteinander in Verbindung stehen. Die 
Logiksektion der ECELL ist dartiberhinaus in der Lage, die 

30 XAPU (0120) mit ihrem gegentiber der APU einer SCELL erweiter- 
ten Funktionsumfahg zu steuern und zu verwalten. 
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Beispielsweise logische Operationen wie beispielsweise NAND/ ' 
NOR, AND, OR, XOR ermoglichen. Eingangsvariablen solcher Ope- 
rationen konnen solche Kriterien sein, die auch zur Bildung 
eines RECONREQ- S i gnal s fuhren, aber auch digitale Signale, 
5 die eigens dafur erzeugt werden. 

Figur 3 zeigt eine mogliche Art der Realisierung von BUFFO 
bzw.\ BUFFI. OP0 ist ein Operationsverstarker, der so be- 
schaltet ist, dafi er das am Eingang IN liegende analoge 

10 Signal wahlweise invertiert oder durchschleift . Die Betriebs- 
art wird durch DeMUXO ausgewahlt. Wenn • am. S.teuereingang 
NONINV INV eine logische 0 liegt, wird das Eingangssignal 
durchgeschleift, wenn am Steuereingang NONINV INV eine logi- 
sche 1 liegt, wird das Eingangssignal invertiert. Ober DeMUXl 

15 wird entschieden, ob das Signal im Kondensator C zwischenge- 
speichert wird (BUFFER) , oder ob es ohne Zwischenspeicherung 
am Ausgang OUT von OP1 zur Verfiigung steht (PASS) . Zwischen- 
speicherung erfolgt, wenn der Steuereingang BUFF PASS eine 
logische 0 erhalt. 

20 Keine Zwischenspeicherung erfolgt, wenn der Steuereingang 
BUFF PASS eine logische 1 erhalt. 



Figur 4 zeigt, wie beispielsweise der Ausdruck f(t) A g(t) be- 

25 rechnet werden kann. 

Dazu wird in der ersten Zelle f (t) logarithmiert, das bedeu- 
tet, von f (t) wird der Logarithmus zur beliebigen, aber 
festen Basis a gebildet. Dazu kann eine SCELL dienen, die als 
Logarithmierer konfigurlert ist. Das Ergebnis dieser Operati- 

30 on wird in der zweiten Zelle mit g(t) multipliziert Dazu 
kann eine ECELL dienen, die beide Signale nach Art eines 
spannungsgesteuerten Verstarkers miteinander multipliziert. 
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In der dritten Zelle wird die Basis a mit dem Ergebnis der 
Multiplikationsoperation potenziert. Dazu kann eine SCELL 
dienen, die als Delogarithmierer konfiguriert ist. Das Ergeb- 
nis der Delogarithmierungsoperation entspricht dem Ausdruck 
5 ([f (t)]*{g(t)>. 

Vorstehend wurde beschrieben, wie eine Einheit mit konfigu- 
rierbaren analogen Einheiten aufgebaut werden kann. Es wurde 
vorgeschlagen, analoge Signale fur Arbeiten mit Zellen so 

10 auszubilden, dass sie im Betrieb anderer Zellen rekonfigu- 
rierbar sind und es wurde vorgeschlagen , ihnen daftir eine 
geeignete Beschaltung zuzuordnen. Es ist nun einzuschatzen, 
dass die MQglichkeit besteht, einen Baustein zu bilden, bei 
welchem eine Signalverarbeitung sowohl analog als auch digi- 

15 tal erfolgt. Es ist dann moglich, die digitale 

Signalverarbeitung gleichfalls mit rekonf igurierbaren Bauele- 
menten vorzusehen, etwa durch ein multidimentionales Feld 
rekonfigurierbarer digitaler Einheiten, wie es in den ver- 
schiedenen Patent anmeldungen des vorliegenden Anmelders 

20 beschrieben wurde. Urn die erforderliche Wandlung vorzusehen, 
konnen einzelne oder mehrere Umsetzerstufen vorgesehen seia, 
. d. h. ein oder mehrere Analog-DigitalrWandler und erforderli- 
chenfalls mehrere Digital-Analog-Wandler . (Jberdies ist es 
moglich, verschiedene Wandlerverf ahren einzusetzen und. die 

25 Genauigkeit der Wandlung bei Vorsehen mehrerer Wandlereinhei- 
ten unterschiedlich zu gestalten. Gleichfalls ist es mGglich, 
neben einfachen logischen Schaltungen, die einem Analogele- 
ment zugeordnet werden, auch kpmplexere Logik-und 
Funktionskreise vorgesehen werden konnen. 

30 

Es wird einzuschatzen sein, dass die Vielzahl der Analogele- 
mente, Busse usw. sowie der gegebenenfalls erforderlichen 
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Wandlereinheiten einem jeweiligen Zweck ohne weiteres anpass- 
bar sind, etwa urn Hochfrequenzanwendungen zu genugen oder, 
bei Niederfrequentenanwendungen, eine extreme Rauscharmut 
bzw. ein sehr gutes Signal- Rauschverhaltnis vorzusehen. 

5 

Es sei weiter erwahnt, dafi bevorzugt die digitalen und analo- 
gen Elemente gemischt werden, insbesondere auf ein und 
demselben IC. Dazu kann in einem gemischtne Feld vermittels 
eines oder mehrer ADCs und/oder DACs und/oder Komparatoren 

10 ein Ubergangsmittel vorgesehen werden. Dies ist vorteilhaft, 
weil etwa im Bereich- Software defined Radio die -rein digitale 
Abarbeitung der ankommenden hochf requenten schwachen Anten- 
nensignale noch problematisch ist f wobei trotzdem auch 
beziiglich der analogen Signalbe- und/oder -verarbeitung eine 

15 grofie Wahlfreiheit erwiinscht ist. 

Die Erfindung betrifft weiter Vorrichtungen und Verfahren zur 
Verbesserung des Transfers von Daten innerhalb von mehrdimen- 
sionalen Anordnungen von Sendern und Empfangern bzw. -zellen. 
20 Dafi diese gerade in kritischen Applikationen wie Software de- 
fined Radio besonders relevant ist, sei erwahnt. 

Die Zellen von etwa multidimensionalen Prozessorfeldern kon- 
nen nun unterschiedlichen Funktionen ausfuhren, etwa 
25 Bool^sche Verknupfungen von Eingangs-Operanden bewirken, 

Zwischen ihnen verlaufen Verbindungen, die gleichfalls ein- 
stellbar sind f typisch etwa Busse f die auf verschiedene Weise 
eine Vernetzung bewirken konnen und so ein in seiner Vernet- 
30 zung* einstellbares multidimensionales Feld aufbauen. OBer die 
Busse oder anderen Leitungen tauschen die Zellen miteinander 
wie erforderlich Informationen aust, etwa Statussignale, 
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Trigger oder die zu verarbeitenden Daten. Typisch sind dabei 
in einem zweidimensionalen Prozessorf eld etwa die Zellen Rei- 
hen- und spaltenweise angeordriet, wobei die Ausgange von 
Zellen einer ersten Reihe auf Busse gefiihrt, an die zugleich 
5 die Eingange der Zellen der nachsten Reihe zu koppeln sind. 
Bei einer bekannten Anordnung (Pact XPP) sind zudem Vorwarts- 
und Rtickwartsregister vorgesehen, um Daten unter Umgehung von 
. Zellen auf Bussysteme anderer Reihen zu leiten, ein Balancing 
von parallel auszuftihrenden Zweigen zu erreichen, usw. Es ist 
10 auch schon vorgeschlagen worden, derartige Vor- und/oder 
. Rtickwartsregister mit einer iiber den reinen Datentransfer 
hinausgehenden Funktionalitat zu versehen. 

Um eine bestirrimte Art der Datenverarbeitung durchzuf tihren, 
15 mufi jeder Zelle eine bestimmte Funktion zugewiesen werden und 
es ist eine geeignete Vernetzung vorzusehen. Es mufi dazu, be- 
vor das multidimensional Prozessorfeld Daten wie gewtinscht 
verarbeitet, festgelegt werden, welche Zelle welche Funktion 
ausfiihren soli, es ist fur jede an einer Datenverarbeitungs- . 
20 aufgabe beteiligen Zelle eine Funktion festzulegen und es mufi 
die Vernetzung bestimmt werden • Dabei ist es wtinschenswert, 
. die Funktion und Vernetzung so zu watilen, dafi die Datenverar-. 
beitung moglichst zugig erfolgen kann. Oftmals ist es jedoch 
nicht mdglich, eine Konf iguration zu f'inden, die den ge- 
25 wtinschten Datentransfer in optimaler Weise gewahrleistet . Es 
mtissen dann suboptimale Konf igurationen yerwendet werden. 

Wunschenswert ist es hier f eine Moglichkeit zu schaffen, die 
Konf igurierbarkeit zu erleichtern. 

30 

Es wird dabei weiter vorgeschlagen, dafi bei elinem multidimen- 
sionalen Prozessorfeld aufweisend eine Vielzahl benachbart 
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angeordneter Datenverarbeitungszellen mit Eingangen, die Da- 
ten von Vernetzungswegen erhalten, einer Operanden- 
Verkniipfungseinheit, die diese entsprechend der jeweiligen 
Funktion ihrer Operanden-Verkniipfungseinheit verkniipfen und 
5 Ausgangen, um die Daten verknupft auf Vernetzungswege aufzu- 
geben, vorgesehen is't, dafi die Datenverarbeitungszellen ein 
Aspektverhaltnis aufweisen, das wenigstens 1,5:1, bevorzugt 
2:1 betragt. Dies ermoglicht das bevorzugte Pipelining in den 
PAEs und/oder den Bussen. Dabei 1st es bevorzugt, aber nicht 
10 zwingend, in insbesondere jeder PAE ein eigenes Pipelining 
vorzusehen, was Takterhohungen ermoglicht 

Damit wird eine wesentliche Verbesserung der Verkniipfbarkeit 
erreicht, ohne dafi teuere Siliziumf lache fur zusatzliche Bus- 

15 verbindungen bereitgestellt werden muB oder eine besodners 

komplexe Topologie gewahlt werden mufi. Die Verbesserungen der 
Verbindbarkeit ergeben sich vielmehr allein daraus, dafi der 
Datentransfer quer zu den Zellen verktirzt wird und damit Da- 
ten innnerhalb ktirzerer Zeiten, bezogen auf die zum 

20 durchstromen bzw. Verarbeiten in der Zelle erforderlichen 

Zeiten selbst, von Zelle zu Zelle gelangen. Damit wachst die 
Anzahl der noch- als . nachste Nachbarn zu bezeichnenden Zellen, 
die also noch innerhalb eines Taktes zu erreichen sind. Es 
0rgibt sich etwa bei zwei dimensional en Feldern eine Anord- 

25 nung, bei der eine Zelle funktional mehr nachste Nachbarn 

besitzt, als sich topologisch bei reiner Geometriebetrachtung 
im zweidimensionalen Fall ergibt. Mit andern Worten ergibt 
sich nur durch die Veranderung des Aspektverhaltnisses funk- 
tional eine mehr als zweidimensionale Konnektivitat . 

30 

Bei den Zellen wird es sich insbesondere um PAE-Zellen mit 
EALU handeln, wie sie per se aus dem vorzitierten Stand der 
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Technik bekannt sind. Bei solchen Zellen wird es sich wie be- 
vorzugt urn grobgranular konf igurierbare Zellen handeln. 

Es ist moglich und bevorzugt, wenn die Datenverarbeitungszel- 
5 len in Reihen und Spalten angeordnet sind. Dies erlaubt eine 
besonders gunstige Auslegung der Zellen, die typisch nahe- 
rungsweise trapezformig bzw. rechteckig sind. Es kann dann 
vorgesehen sein, dafi zumindest bei einem Teil der Datenverar- 
beitungs zellen Dateneingange vorgesehen sind, urn von einer 
10 oberen Reihe Daten zu erhalten und Datenausgange, um an eine 
untere Reihe Daten . auszugeben. .In. einem solchen Fall* ergibt 
sich die verbesserte Konnektivitat in beiden Reihen. 

Typisch wird es sich um ein Prozessorf eld handeln, bei dem 
die Datenverarbeitungseinheiten EALUs, ALU und/oder register- 
flankierte Zellen sind, d.h. es werden zur Verbindung 
unterschiedlicher Reihen typisch neben den datenverarbeiten- 
den und dabei Daten verzogerungsf rei, d.h. etwa 
schnellstmoglich weiterleitenden Zellen noch Register vorhan- 
den sein, die gerade dazu dienen, Daten bei der Weiterleitung 
zu verzogern, sei es, um unkontrollierte Riickkopplungsschlei- 
fen zu verhindern. bzw. unterbrechen (Prinzip der sog. 
Annihilated Feedback Loop Termination- sog. AFTER-Zellen.) 
oder bei datenauf spaltendem Durchlauf en von Zweigen und nach- 
folgendem Wiedervereinigen einen zeitlichen Gleichlauf zu 
erzwingen (Balancing) . 

Mit einem solchen Prozessorf eld ist es nun moglich, eine Kon- 
figuration derart zu wahlen, daB, wenn Zellen fiir die 
30 Konfiguration ausgewahlt und in Funktion und Vernetzung be- 
stimmt werden, wobei eine Vernetzung derart bestimmt wird, 
dafi Daten von Zelle zu Zelle zumindest weitgehend verzoge- 
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rungsfrei tibertragbar sind, vorgesehen ist, dafi als benach- 
barte Zellen, zwischen denen Daten binnen eines Taktes oder 
einer geringen Taktzahl ubertragbar sind, auch solche beruck- 
sichtigt werden, die nicht unmittelbar nebeneinander liegen, 
5 sondern in der Breite durch eine Strecke getrennt sind, die 
geringer ist als die Lange der Zelle. Dafi eine Heruntertak- 
tung der Zellen im Vergleich zu den Bussen per se moglich 
ist, sei als bevorzugt offenbart. Of f ensichtlich kann aber 
auch in Ausnahme fallen eine in die andere Richtung gehende 
10 Taktabweichung erfolgen oder auf eine solche verzichtet wer- 
den. 

Es sei darauf hingewiesen, dafi das angegebene minimale 
Aspektverhaltnis das wenigstens 1,5:1 betragt, bevorzugt noch 
15 grofiere Werte annimmt und sich bei sorgfaltiger Auslegung der 
Einheiten durchaus im Bereich zwischen 5:1 und 10:1 bewegen 
kann. 

Die Erfindung wird im folgenden anhand der Zeichnung be- 
20 schrieben, worin gezeigt ist durch 

Fig. CI ein Prozessorfeld der vorli'egenden Erfindung 

25 Nach Fig. 1 umfafit ein allgemein mit 1 bezeichnetes Prozes- 
sorfeld 1 eine Vielzahl benachbart angeordneter 

i 

Datenverarbeitungs zellen 2 mit Eingangen 3, die Daten von 
Vernetzungswegen 4 erhalten r einer Operanden- - 
Verknupfungseinheit 5, die diese entsprechend der jeweiligen 
30 Funktion ihrer Operanden-Verknupfungseinheit 5 verknupfen und 
Ausgangen 6 f um die Daten verknupft auf Vernetzungswege 4 
aufzugeben, wobei die Datenverarbeitungs zellen bzw. ihre da- 
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tendurchf lossene Operanden-Verknupf ungseinheit 5 ein Aspekt- 
verhaltnis von Lange zu Breite aufweisen, das grofler ist als 
2:1 betragt. 

5 Bei dem Prozessorf eld 1 handelt es sich vorliegend um eine 
per se als XPP bekarinte Anordnung; alternativ kann es als ein 
Array aus zur Lauf zeit partiell rekonf igurierbaren Elementen 
angeordnet sein konnen, etwa als Prozessor, Koprozessor, DSP, 
usw.. Das Prozesssorfeld ist im dargestellten Fall aus 3 Rei- 
10 hen und 4 Spalten aufgebaut, aber nur aus Grunden der 

Ubersichtlichkeit so vergleichsweise klein gewahlt. T.ypisch 
wird es grofler ausgelegt werden. 

Die Datenverarbeitungszellen 2 sind grobgranular konfigurier- 
15 bar und weisen f eingranulare Statemachines auf. Sie sind auf 
per se bekannte Weise rekonf igurierbar, ohne den Betrieb zu 
storen. Auf die hier realisierte, aber nicht naher zu erlau- 
ternde Moglichkeit der zentralen Konf igurationsvorgabe etwa 
durch einen Konf igurationsmanager, der Waverekonfiguration 

20 etc. sei hingewiesen. Die Zellen enthalten als Operanden- 

i 

Verknupfungseinheit 5 eine ALU-Einheit f in der arithmetische 
Operationen wie Addition, Multiplikation, Subtraktion und Di- 
vision an bis zu drei eingehenden Operanden durchgefuhrt 
werden konnen f sowie Verknupfungen wie ISTgrofler? ISTkleiner? 
25 IStNUll? sowie XOR, OR, AND NAND etc. Die ALO-Einheit ist 

mittig angeordnet und flankiert von einem Vorwarts- und einem 
Ruckwartsregister, die in per se bekannter Weise uber die An- 
schliisse der Datenverarbeitungszelle 2 gleichfalls mit den 
Vernetzungswegen 4 verbunden werden konnen. 

30 

Die Datenein- und ausgange 3 bzw 6 sind uber Multiplexer mit 
den Verbindungswegen 4 verbunden. Es ist im vorliegenden Fall 
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ein Bussystem mit einer Vielzahl von Leitungen vorgesehen, urn 
die Zellen in den Reihen und Spalten konf igurierbar miteinan- 
der zu vernetzen. 

5 Das Aspektverhaltnis der ALU-Einheit betragt nun im darge- 
stellten Beispiel 6:1, d.h. die Zelle ist sehr viel langer 
als breit. 

Die Anordnung wird nun verwendet wie folgt: 

10 

Es wird zunachst ein Programm. zur Ausf uhrung auf dem Array 1 
ausgewahlt. Dann wird mit per se bekannten Mitteln eine Kon- 
figuration bestimmt, die einen optimalen Daten-Durchsatz 
erlaubt- Hierbei wird nun ber.iicksichtigt, dafi Daten auch an 

15 Zellen, die nicht unmittelbar in der Reihe darunter oder 
seitlich neben einer gegebenen Zelle liegen, sondern z.B. 
drei Spalten seitlich versetzt sind, innerhalb eines Verar- 
beitungs-Taktes Daten erhalten konnen, ohne dafi grofiere 
VerzSgerungen auftreten. Die unter Berucksichtigung dieser 

20 erweiterten Nachste-Nachbar-Definition erhaltene Konfigurati- 
on wird auf das Array auf konf iguriert und ausgefuhrt. 

Die vorliegende Erfindung befasst siqh aber nicht nur mit dem 
25 vorteilhaften Aufbau eines multidimeiisionalen Feldes rekonfi- 
gurierbarer Elemente wie bei rekonf igurierbaren Prozessoren, 
sondern auch mit Verfahren zu deren Betrieb, etwa derart, dafi 
eine Obersetzung einer klassischen Hochsprache (PROGRAMM) wie 
Pascal, C, C++, Java etc. auf eine rekonf igurierbare Archi- 
30 tektur ermoglicht wird. 
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Oftmals wird hier nicht das gesamte multidimensionale Feld 
rekonfigurierbarer Elemente samt aller zwischen den Daten 
handhabenden Elemten vorgesehenen Bussystemen, Verbindungs- 
leitungen usw. zur Umkonf iguration freigegeben, sondern es 
5 besteht vielmehr das Erfordernis, eine neue Aufgabe einem 

kleinen Teilbereich des multidimensionalen Feldes zuzuordnen. 
Es ist uberdies haufig nicht vorhersagbar, wie dieser Teilbe- 
. reich beschaffen sein wird. Dies gilt insbesondere dann, wenn 
auf dem multidimensionalen Feld rekonfigurierbarer Elemente 
10 mehrere Aufgaben parallel abgearbeitet werden mussen, etwa im 
Wege des Mult it as king , und/oder nicht vorhergesagt werden 
kann, wann dort, etwa bei Echtzeitanwendungen, welche Res- 
sourcen zwecks Umkonf iguration freigegeben werden. 

15 Prinzipiell besteht die Moglichkeit, einen Code, der auf dem 
multidimensionalen Feld rekonfigurierbarer Elemente abgear- 
beitet werden soil, zur Laufzeit zu iibersetzen, also erst 
dann, wenn die Abarbeitung anderer Aufgaben schon begonnen 
hat, festzulegen, wie der als nachstes auszufuhrende Code be- 

20 stimmten rekonf igurierbaren Elementen zuzuordnen ist, wie die 
Verbindung zwischen diesen laufen soil, welche Zwischenspei- 
cherungen erforderlich sind usw. Es' ist einsichtig f dass eine 
solche Vorgehensweise' zur Obersetzung einen vergleichsweise 
hohen momentanen Datenverarbeitungsaufwand erfoxdert. Gerade 

25 in kritischen Rechnerapplikationen, die ein H^chstmaB an Re- 
chenleistung erfordern, ist es gewiinscht, fiir eine solche 
Obersetzung wahrend der Laufzeit keine zusatzliche Rechenlei- 
stung zu verbrauchen, Es ist daher auch schon tiblich, 
Programmcode vor Beginn des Programmes zu kompilieren und 

30 dann Teilkonf igurationen zu bestimmen, die jeweils in das 
Feld hinein konfiguriert werden, sobald dort entsprechende 
Ressourcen frei sind. 



- 43 - 



WO 2004/021176 



PCT/EP2003/008081 



Ein Problem besteht allerdings darin, dass, gerade bei Echt- 
zeitanwendungen, im Vorfeld nicht feststeht, wie die jeweils 
verfugbaren Ressourcen angeordnet sind. Dies betrifft einer- 
5 seits die Funktionalitat der zur Datenhandhabung verfugbaren 
Elemente, in die hiriein konfiguriert werden konnte, sofern 
nicht alle Daten handhabenden Elemente dieselbe Funktion be- 
sitzen. So ware denkbar, in einem multidimensionalen Feld 
rekonf igurierbarer Elemente verschiedene Zellen mit Rechen- 

10 werken auszustatten, die fur Fliefikomma-Berechnungen 

ausgelegt sind, Elemente ■ vorzusehen, die. lediglich Bool'sche 
Daten handhaben, Elemente , die uber zugeordnete Speicher ver- 
fiigen, Elemente, mit oder in denen Sequenzer vorgesehen 
werden konnen usw, Hier ist eine Ausfiihrung mit Vorkompilie- 

15 rung darauf angewiesen, entweder mit der Umkonf iguration zu ' 
warten f bis genau jene Zellen zur Verfiigung stehen, die die 
in der Vorkompilierung festgelegten Funktionen und Anordnun- 
gen besitzen. Auch mufi bei der Vorkompilierung zudem der 
kleinste, alien Zellen gemeinsame Funktionsumfang verwendet 

20 werden. Beides verschwendet Ressourcen. Zudem ist meist nicht 
klar, wie die fur die Umkonf iguration f reigegebenen Elemente 
angeordnet sind und welche Verbindungen verfugbar sind; auch 
dadurch wird gegebenenf alls die Hineinkonf iguration einer 
neuen Aufgabe (Task) massiv erschwert. 

25 

Das Problem wird noch gravierender, wenn grofie Bereiche des 
multidimensionalen Feldes freigegeben werden und prinzipiell 
die Moglichkeit und/oder der- Zwang besteht, mehrere Konfigu- 
rationen fur unterschiedliche Aufgaben gleichzeitig in das 
30 Feld hinein zu konf igurieren. 
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Es wird somit gemaB einem ersten wesentlichen Aspekt der Er- 
findung ein Verfahren zum Betrieb eines multidimensionalen 
Feldes rekonf igurierbarer Elemente vorgeschlagen, worin Grup- 
pen zusammen datenhandhabender Elemente in vorbestimmter 
Weise wahrend der Lauf zeit zur Abarbeitung vorgegebener Auf- 
gaben im Feld konf icjuriert werden und wobei vorgesehen ist, 
dass fur zumindest eine abzuarbeitende Aufgabe eine Mehrzahl 
von solchen Elementgruppenanordnungen im multidimensionalen 
Feld bestimmt wird, die zur Abarbeitung der vorgegebenen Auf- 
gabe geeignet sind, fur die Abarbeitung der vorgegebenen 
Aufgabe eine dann besonders geeignete Elementgruppenanordnung 
aus der Mehrzahl ausgewahlt wird und die ausgewahlte Anord- 
nuhg in das Feld hinein konfiguriert wird. 

Die Erfindung schlagt somit vor, bei der Vorbereitung der ei- 
gentlichen Datenverarbeitung eine Vielzahl von Anordnungen 
bzw. Konfigurationen vorherzubestimmen und dann aus den vor- 
bestimmten Elementgruppenanordnungen eine solche auszuwahlen, 
die fur die Abarbeitung der vorgegebenen Aufgabe bei den dann 
gegebenen Feldressourcen besonders gut geeignet ist. Damit 
ist eine wesentliche Verbesserung im Betrieb eines multidi- 
mensionalen Feldes rekonf igurierbarer Elemente im 
Wesentlichen durch eine einfache Erweiterung des Compilers 
gegeben, mit dem die zuvor programmierten Codes tibersetzt 
werden, und zwar dadurch, dass dieser nicht nur eine einzig.e 
Konfiguration fur eine gegebehe Aufgabe bestimmt, sondern 
mehrere solcher Konfigurationen und somit ausntitzt, dass kei- 
ne eindeutige Losung ftir das Problem besteht, ein Stuck 
gegebenen Hochsprachecode auf ein multidimensional.es Feld re- 
konf igurierbarer Elemente zu tibersetzen. Es sei erwahnt f dafi 
hier der Begriff "Compiler" verwendet wird fur ein Mittel, 
das Konfickurationen bestimmt,. unabhangig davon, ob es sich 
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urn einen Routerteil, einen Ubersetzerteil oder einen anderen 
Teil eines Mittels zur Konf igurationsbestiramung anhand von 
Programmcodes handelt. Dieses ' Mittel kann mittels Festver- 
drahtung, d. h. als Hardware oder als Softwareprogramm 
5 realisiert sein. 

Es ist moglich, aus dieser Vielzahl von potentiell moglichen 
Konfigurationen, die zur Abarbeitung eines gegebenen Stuck- 
Codes moglich sind, eine Auswahl anhand der Geometrie zu 

10 treffen, die diese Elementgruppenanordnung im Vergleich zu 

jener besitzt, .die die im multidimensionalen Feld fur die Um- 
konfiguration verfugbaren bzw. vermutlich bald verfugbar 
werdenden Elemente besitzen. So kann durch einen einfachen 
Miistervergleich versucht werden f eine Konf iguration, d. h. 

15 Elementgruppenanordnung , auszuwahlen, die moglichst alle der 
frei gewordenen oder frei werdenden Elemente abdeckt bzw. 
moglichst wenig Elemente des multidimensionalen Feldes unge- 
nutzt lasst. Wenn lediglich auf die Geometrie Rucksicht 
genommen wird, etwa weil alle Daten handhabenden Elemente des 

20 multidimensionalen Feldes den fur die Hineinkonf iguration er- 
forderlichen Funktionsumfang besitzen, so kann die Auswahl 
mit per se bekannten Algorithmen wie bei der Schnittmusterop- 
timierung erfolgen. Es kann dabei entweder auf die bereits 
verfugbaren Elemente Bezug genommen werden. oder es kann f ins- 

25 besondere im Hinblick darauf , dass die Umkonf iguration 

oftmals die (Jbertragung von Konf Igurationsdaten zu den Ele- 
menten umfasst und eine solche 

Umkonfigurationsdatenubertragung Zeit in Anspruch nimmt f vor- 
gesehen werden, dass auch vermutlich bald verfugbare Elemente 
30 mit bei der Auswahl der jeweils optimalen Geometrie bertick- 
sichtigt werden. Dabei kann ausgenutzt werden, dass es haufig 
moglich ist, vorherzusagen, dass bestimmte Elemente bald fur 
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die Umkonf iguration verfiigbar warden, etwa wenn sie Daten ftir 
die Weiterverarbeitung von Zellen erhalten haben, die bereits 
ihre Umkonf igurierbarkeit angedeutet haben und die Anzahl der 
noch erf orderlichen Verarbeitungstakte, der hierzu daten- 
5 stromabwarts liegenden Zellen endlich und abschatzbar oder 
bekannt ist. Derartige Information ist erf indungsgemafi als 
Umkonf igurierbarkeits-Vorhersage verwaltbar. Dafi zu den ver- 
fiigbaren und/oder benotigten Elementen auch Busverbindungen, 
Leitungen etc, zahlen, sei erwahnt. 

10 

• Die Auswahl der optimalen Konf iguration kann dabei in einem 
Praprozessor oder einem Teilbereich des multidimensionalen 
Feldes der rekonfigurierbaren Elemente erfolgen und insbeson- 
dere von einem Datenverarbeltungsprogramm und/oder -mittel 

15 ubernommen werden, das die Durchfuhrung der verschiedenen 

Aufgaben zeitlich koordiniert, Priorisierungen vornimmt usw. 
Es kann sich hierbei insbesondere urn einen Teil eines Be- 
triebssystems h'andeln, sofern das multdimensionale Feld 
rekonf igurierbarer Elemente als Prozessor oder Koprozessor 

20 ausgefuhrt ist. Die Verwendbarkeit der CT f eines Schedulers 
fur Hyperthreading f Multitasking, Multithreading usw. sei er- 
wahnt. Auf entsprechende weitere Teile der vorliegenden 
Anmeldung sei diesbeztiglich verwiesen. Dafi solche Einheiten 
hard- und/oder softwaremaBig implementierbar sind> sei er« 

25 wahnt. 

Gerade dann, wenn Konfiguratiohsdaten aus einem Speicher ein- 
gelesen werden, der nicht vernachlassigbare Zugrif fszeiten 
besitzt, bzw. wenn sie, sollte eine Echtzeitbestimmung einer 
30 Konfiguration gewtinscht werden, mit nicht vernachlassigbaren 
Generierungszeiten generiert werden, ist es wtinschenswert, 
zunachst einen Kenndatensatz vorzusehen, der gegeniiber dem 
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eigentlichen Konf igurationsdatensatz in der Grosse reduziert 
ist und dann eine Auswahl nur auf Grund dieses Kenndatensat- 
zes zu treffen. So kann etwa beim Laden einer neuen 
Konfiguration aus einem langsamen Speicher wie von einer 
5 Festplatte zunachst lediglich ein Kenndatensatz bzw. eine 
Kenndatensatzgruppe 'heruntergeladen werden, der die Umrisse 
der Konfiguration betrifft. Da ein solcher Umriss kenndaten- 
satz in der GroISe gegeniiber dem vollstandigen 
Konfigurationsdaterisatz typisch sehr reduziert sein wird, ist 

10 es auch mdglich, eine Vielzahl von Kenndatensatzen fur eine 
Vielzahl unterschiedlicher Konf igurationen vorab in einen 
Hauptspeicher zu laden, der einen sehr schnellen Zugriff er- 
laubt, an Hand der unterschiedlichen Konfigurationsdatensatze 
eine schnelle Auswahl zu treffen und dann aus dem langsamen 

15 Speicher die kompletten Konf igurationsdaten zur ausgewahlten 
Konfiguration herunter zu laden. Es sei darauf hingewiesen, 
dass es in solchen Fallen auch moglich ist, einen Teil der 
Konfigurationen vorneweg miteinzulesen, etwa dann, wenn ab- 
sehbar ist, dass bestimmte Konfigurationen typisch bevorzugt 

20 sind, sei es, weil statist ische Auswertungen des typischen 

Datenverarbeitungsbetriebes fur eine Vielzahl von multidimen- 
sionalen Feldern rekonf igurierbarer Element e oder fur ein 
einzelnes multidimensionales Feld. dies ergeben haben, etwa 
we.il zu einer Gruppe von Anwendungen wie im UMTS-Base- 

25 Station-Bereich durch Analyse typischer Aufgaben festgestellt 
wurde, dass bestimmte Umkonf igurationen beso.nders haufig auf- 
treten, oder weil fur einen einzelnen Benutzer festgestellt 
wurde, dass immer wieder dieselben Anwendungen parallel in 
bestimmter Weise in das Feld hinein konfiguriert werden mtis- 

30 sen.- Das Vorab-Mit laden bestimmter Konfigurationen kann auch 
dann sinnvoll sein, wenn sich diese Konfigurationen durch ei- 
ne besonders einfache Geometrie auszeichnet, etwa weil sehr. 
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kleine Volumina des multidimensionalen Feldes rekonf igurier- 
barer Elemente davon tiberdeckt werden (Volumina nimmt hier 
auf das Volumen des multidimensionalen Feldes Bezug, bezeich- 
net also bei zweidimensionalen Felder rekonf igurierbarer 
5 Elemente die Flache bzw. Flachengeometrie der fur die Umkon- 
figuration verfugbaren rekonf igurierbaren Elemente etc.). 

Es ist auch moglich und insbesondere bei der Abarbeitung kom- 
plexer Auf gabenstellungen, sei es durch die Abarbeitung 

10 besonders rechenintensiver Probleme, sei es im Multitasking, 
Multithreading oder bei anderen Formen der Parallelabarbei- 
tung von Daten, auch bevorzugt, zu iiberpriifen, ob mehrere, 
insbesondere gleich priorisierte Elementgruppenanordnungen 
fur unterschiedliche Aufgaben simultan durch geeignete Aus- 

15 wahl in das Feld hinein konfigurierbar sind. Dabei kann, 

abhangig von der Priorisierung einer bestimmten Aufgabe vor- 
gesehen werden, dass die fur die Abarbeitung einer 
vorgegebenen Aufgabe zur Verfugung gestellte Flache oder Ab- 
arbeitungszeit grofier oder kleiner ausfallt, etwa indem durch 

20 Aufbau von Sequenzern mit den Daten handhabenden Elementen 
die Grofie einer Konfiguration unter Verlangsamung der Daten- 
abarbeitung verringert wird.. 

Es kann auch erwunscht sein f dass zunachst eine erste Ele- 
25 mentgruppenanordnung in das Feld hinein konfiguriert wird und 
begonnen wird, mit dieser Elementgruppenanordnung die Aufgabe 
abzuarbeiten, bis ein vorgegebenes Ereignis auftritt und dann 
unter zumindest partieller Rekonf iguration mit der Aufgaben- 
abarbeitung in einer weiteren Elementgruppenanordnung 
30 fortgefahren wird. Hierbei kann etwa vorgesehen werden, dass 
zur Erzielung einer bevorzugten Geometrie von Konf igurationen 
auf dem multidimensionalen Feld, etwa streifenf ormig hinter- 
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einander angeordneten Zellen fur jede Aufgabe, zu festgeleg- 
ten Taktzeiten, etwa alle tausend, zehntausend oder 
hunderttausend Takte, die Abarbeitung aller oder eines Teiles 
aller Konf igurationen unterbrochen wird, die Ergebnisse wie 
5 erforderlich zwischengespeichert werden, auch was nur in ei- 
ner Konf igurat ion intern erf orderliche Daten wie Schleifen-, 
Zahlerstande usw. angeht, und dann eine Neukonf iguration mit 
entsprechenden, bevorzugten Geometrien vorgenommen wird, um 
so ein allmahliches Zerfasern von Konf igurationen zu vermei- 
• 10 den, was schon aufgrund des erhohten Bedarfs an Busleitungen 
uherwunscht ist. 

Alternativ und/oder zusatzlich ist es auch moglich, selbst- 
faltende Konf igurationen vorzusehen, wobei etwa zunachst mit 

15 der Abarbeitung einer Konf iguration iiber das gesamte Array 
begonnen wird, und sich dann, sobald zusatzliche Ressourcen 
durch eine andere Aufgabe angefordert werden, diese erste 
Konf iguration mehr oder minder selbsttatig zusammenzieht, et- 
wa durch Sequenzerbildung mit einem Element, um Element e fiir 

20 die neue Aufgabe freizugeben. Dieses Zusammenziehen kann 

durch Vorgabe neuer, Platz sparenderer Konf igurationen fur 

ein und dieselbe Aufgabe erreicht werden, insbesondere dann, 
I 

wenn diese Platz sparenderen Konf igurationen in bei den Daten 
handhabenden Elementen vorgesehenen Konf igurat ionsspeichern 
25 mit abgelegt werden. Auf die Anmeldung zur Wave- 

Rekonf iguration sei dabei nur beispielsweise hingewiesen. Es 
ergibt sich dann eine Situation, bei der Konf igurationen all- 
mahlich enger und enger zusammenrucken.. 

30 Die Auswahl einer vorgegebeneh Elementgruppenanordnung, die 
in ein Feld hinein zu konf igurieren ist, kann, abgesehen von 
der verfugbaren Geometrie, auch von anderen Parametern abhan- 
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gig gemacht werden. Hierzu zahlt unter anderem die erzielbare 
Abarbeitungsgeschwindigkeit, die Prioritat einer Aufgabe 
und/oder der Energieverbrauch, der zur Abarbeitung einer vor~ 
gegebenen Aufgabe in einer vorgegebenen Zeit erforderlich 
5 ist. Es sei darauf hingewiesen, dass mehrere Parameter 

gleichzeitig betrachtet werden konnen, sei es dadurch, dass 
zunachst anhand eines ersten Parameters wie des benotigten 
Feldvolumens als gleichwertig angesehene Konf igurationen 
durch Betrachten eines zweiten Parameters verworfen werden f 
10 sei es, indem, etwa mit Methoden der unscharfen Logik, mehre- 
" re Parameter gleichzeitig sowelt wie moglich optimiert 
werden . 

Die Erfindung wird nun im Folgenden nur beispielsweise anhand 
15 der Figuren erlautert, worin gezeigt ist durch 

Fig. Dl ein multidimensionales Feld Daten handhabender 
Elemente in teilweise zu rekonf igurierendem Zu- 
stand; 

20 Fig. D2 Beispiele fur unterschiedliche Konf igurationsgeo- 

metrien; 

Fig. D3 ein teilweise zur Laufzeit umkonf igurierter Pro- 
zessor. 

25 Nach Fig. 1 umfasst eine allgemein mit 1 bezeichnete Daten- 
verarbeitungsvorrichtung 1 ein multidimensionales Feld 
rekonfigurierbarer Elemente 2 sowie einen Preprocessor 3, der 
Konfigurationen in das multidimensionale Feld 1 uber geeigne- 
te Datenbusse 4 einspeist und Inf ormationen liber 

30 rekonfigurierbare Elemente aus dem multidimensionalen Feld 2 
mehrere Elemente erhalt sowie mit einem Speicher 5 mit lang- 
samem Zugriff verbunden ist f in dem Konfigurationen fiir in 
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dem multidimensionalen Feld 2 abzuarbeitende Aufgaben vorab 
abgelegt sind. 

Der multidimensionale Prozessor 1 ist im vorliegenden Bei- 
5 spiel eine XPU-Architektur, die PAE als konf igurierbare 

Elemente aufweist und nach PACT02, 04, 08, 10, 13 aufgebaut 
ist. Er erhalt Daten von Eingabe-/Ausgabe-Schnittstellen 6 in 
Echtzeit zur Abarbeitung, wobei nicht vorhersehbar ist, wie 
diese Daten eintreffen und/oder abzuarbeiten sind. Es konnen 
10 hierfur eine Tastatur, Bilder abrufende Karaeras, A/D-Wandler 
usw. vorgesehen sein. 

Das multidimensionale Feld 2 besteht, zur Vereinfachung der 
Veranschaulichung, obwohgl technologisch keinesfalls zwin- 

15 gend, vorliegend nur aus einer Reihe ausschliefilich 

identischer datenhandhabender Elemente, zwischen denen geeig- 
nete Vernetzungen uber Busse und dergleichen konfigurierbar 
sind. Aus Grunden der Anschaulichkeit wird vorliegend von un- 
begrenzten Busressourcen ausgegangen, obgleich rein praktis.cn 

20 die typische Anwendung auch solcher Ressourcen und deren 

Knappheit bei der Vorabbestimmung multipler Konf igurat ions - 
moglichkeiten beriicksichtigt wird. Die datenhandhabenden 
Elemente sind im vorliegenden Fall geeignet, sequenzartig die 
Befehle abzuarbeiten, wie dies per se bekannt ist, das heifit, 

25 es ist mQglich, Sequenzer uber einzelne Zellen oder Gruppen 
derer aufzubauen. Dafi hierbei ein Zeitteilungsmultiplexing 
moglich ist, sei erwahnt. Dies erlaubt eine entsprechende 
Faltung mehrerer Operationen, dann dann bei grofien Arrays 
bzw. mehr Platz auch ausgefaltet werden konnen. 

30 

Das multidimensionale Feld 2 ist lauf'zeitrekonfigurierbar, 
das heifit es ist moglich, einzelnen der datenhandhabenden 
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Eleniente oder Gruppen derer neue Aufgaben wahrend der Lauf- 
zeit zuzuordnen, ohne den Betrieb der Gesamt-Anordnung oder 
anderer Elemente bzw. Gruppen * derer insgesamt zu unterbre- 
chen. Wie bevorzugt und per se bekannt sind den 
5 datenhandhabenden Elernenten Konf igurationsspeicher lokal zu- 
geordnet, genau so Wie Register, namlich Forward- und 
Backward-Register, Busleitungen, f eingranulare Zustandsma- 
schinen zum Austausch von Triggersignalen untereinander und 
mit der Praprozessoreinheit 3 usw. Auf die Moglichkeit der 

10 Ausgestaltung der rekonf igurierbaren Elemente nach PCT-DE 

97/02949, PCT-DE 97/02998, PCT-DE 98/00334, .PCT/DE 99/00504, 
PCT/DE 99/00505, PCT/DE 00/01869 usw. sei hingewiesen. Die 
vorgenannten Schutzrechte und die weiteren Schutzrechte des 
Anmelders zu rekonf igurierbaren Prozessoren, deren Teilen und 

15 Verfahren zu deren Betrieb sind zu Of f enbarungszwecken voll- 
umfanglich integriert. 

Der Praprozessor 3 ist dazu ausgebildet, Konf igurationen in 
das multidimensionale Feld hinein zu laden und zwar liber Lei- 

20 tungen 4, wenn er aus dem multidimensionalen Feld die Meldung 
erhalt, dass einzelne Elemente oder Gruppen derer rekonf igu- 
rierbar sind. Der Praprozessor 3 enthalt einen lokalen 
Speicher (Cache) und ist mit einem weiteren Speicher 5 (Hard- 
disk, RAM) verbunden, auf den langsamer zugegriffen werden 

25 kann und auf dem Konfigurationsdaten abgelegt sind. Geeignet 
ist etwa eine CT. 

Es sei darauf hingewiesen, dass es nicht erforderlich ist, 
den Praprozessor 3 als externes Bauteil vorzusehen. Die ge- 
30 zeigte Darstellung wurde ausschliefilich aus didaktischen 

Grunden gewahlt. Er kann integriert sein mit dem multidimen- 
sionalen Feld 2 auf einem einzelnen Chip und/bder seine 
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Funktion kann durch einzelne Daten handhabende Elemente 2 des 
Prozessorfeldes ausgefuhrt werden. 

Uber die Leitungen 4 werden Konf igurationsdaten und Konfigu- 
5 rationsanforderungen ubertragen. Auf die Implementierung von 
Rdy/Ack-Protokollen,' Vorab-Konf iguration von Elementen in 
elementennahen Speichern etc., die moglich, aber nicht zwin- 
gend ist, wird hingewiesen. 

10 Im Speicher 5 sind nun eine Vielzahl von Konf igurationen fur 
unterschiedliche Aufgaben und Kenndaten hierzu abgelegt. Dies 
wird fur ein einf aches Beispiel mit Bezug auf Fig, 2 erlau- 
tert. 

15 Nach Fig. 2 sind etliche Konf igurationen fur zwei Aufgaben a) 
und b) abgelegt. Wie ersichtlich, sind fur die Aufgabe a) 
insgesamt vier Konf igurationen abgelegt, die alle dieselbe 
Funktion ausfiihren, aber unterschiedliche Verbindungen der 
Zellen untereinander haben und sich insbesondere hinsichtlich 

20 ihrer aufieren geometrischen Gestalt unterscheiden, in der die 
Zellen angeordnet sind. 

Wie ersichtlich, sind beispielsweise drei Konf igurationen 
vor abgelegt, in denen sieben datenhandhabende Elemente wie 

25 PAEs benotigt werden und eine Konf iguration, in der unter 
Ausnutzung der Sequenzereigenschaft der datenhandhabenden 
Elemente nur vier Elemente benStigt werden. Die geometrische 
Form der jeweiligen Konf iguration ist dabei wie durch die 
Zahlen in Klammern angedeutet, gleichfalls mitabgelegt. Die- 

30 ser Kenndatensatz umfasst eine erste Ziffer, die angibt, 
wieviele Spalten Abstand die aufiersten Zellen links und 
rechts voneinander haben; es folgen dann nach einem Komma die 
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Anzahl der Elemente in einer Spalte, die benotigt werden, 
Sind in einer Spalte Reihen frei, d. h. nicht belegt, steht 
gleichfalls ein b in der Kennung. 1st dabei eine Spalte frei- 
gelassen, das heifit von der jeweiligen Konf iguration bis auf 
5 Busse nicht belegt , so steht hierfiir ein b. in der Konf igura- 
tion. Dies ist ersichtlich an den Konf igurationen I und II. 
Die Daten zu einer Spalte sind von jenen der nachsten Spalte 
durch Komma getrennt. Ahnliche Konf igurationsdaten sind auch 
fur eine zweite Konfiguration abgelegt b) . 

10 

Die Anordnung wird verwendet wie folgt: 

Wenn im multidimensionalen Feld rekonf igurierbarer Elemente 
Ressourcen fur die Rekonf iguration freigegeben sind, wie dies 

15 durch die "0" in Fig. 2 dargestellt ist, so ladt der Prapro- 
zessor 3 aus dem Speicher 5 zunachst die wenig umfangreichen 
und damit schnell zu ladenden Kennsatze zu -den Konf iguratio- 
nen. Er bestimmt dann, welche Aufgabe schnell abzuarbeiten 
ist und welche Konf igurationen gemeinsam besonders gut in das 

20 Feld eingeladen werden konnen.. Dies geschieht durch Vergleich 
der maximalen Spaltenbreite einer moglichen Konfiguration mit 
der tatsachlich verfugbaren Spaltenbreite. Zur Aufgabe a) 
konnen so Konfiguration III und IV verworfen Werden f die zu- 
viel Spalten benotigen. Aus den verbleibenden sind aufgrund 

25 der geometrischen Form die Konf igurationen I und II gleich- 
falls zu verweirfen. Es wird dann untersucht, welche 
Konfiguration von b) zu laden ware. Hier sind per se alle 
drei Konf igurationen ladbar. 

30 Nun- wird untersucht, ob es eine Moglichkeit* gibt f von den 
verbleibenden Konf igurationen zu den Aufgaben gleichzeitig 
zwei Konf igurationen in das Feld zu laden. Dazu werden die 
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Konf igurationen in unterschiedlicher Weise aneinander gesetzt 
und es wird die benotigte maximale Spalten- und Reihenzahl 
mit der verfugbaren Maximalzahl verglichen. Es wird so fest- 
gestellt, dafi sich eine optimale Ausnutzung der 
5 f reigewordenen Element e ergibt, wenn die Konf iguration lb und 
die Konfiguration la* unmittelbar ubereinander angeordnet wer- 
den. Diese Konf igurationen werden dann in das Prozessorf eld 
geladen. 

10 Daraufhin kann die Datenverarbeitung mit einer Konfigurati- 
onsanordnung wie in Fig- 3 gezeigt fort gesetzt werden. 
Es sei erwahnt, dass in Fallen, in denen unterschiedliche Da- 
ten handhabende Elemente vorgesehen werden, die entsprechende 
Information gleichfalls im Kenndatensatz abgelegt werden 

15 kann. 

■ Wie vorstehend ersichtlich, ist die Art und Weise, wie ein 
gegebenes Prozessorf eld fur eine vorgegebene Weise konfigu- 
riert werden mufi, nicht eindeutig.' Dies gilt insbesondere 

20 dann, wenn es sich urn komplexe Felder handelt, bei denen etwa 
zumiridest zum Teil in den Leitungen Register vorgesehen sind 
und weiter mit diesen insbesondere auch Additionen und/oder 
Vergleiche von Daten durchzufiihren sind # wie dies auch in 
arithmetische Logikeinheiten (ALUs) aufweisenden Logikzellen 

25 des Feldes der Fall sein kann. Oft ist es auch moglich 

und/oder notig, etwa bei Inbetriebnahme, aus vielen Konfigu- 
rationen mehrere mogliche zu wahlen. 

Es ist bereits vorgeschlagen worden f eine Konfiguration aus 
30 mehreren per se verwendbaren auszuwahlen anhand der momenta- 
nen Konfigurierbarkeit unter geometrischen Aspekten, der 
Ressourcenverfugbarkeit und/oder auszuwahlen aufgrund von Ge- 
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schwindigkeitsaspekten. Dies kann die Auswahl erleichtern, 
stellt aber oftmals nur unzureichende Kriterien dar. Es ist 
wiinschenswert, die Konf igurationsauswahl weiter verbessern zu 
konnen. Es ist weiter oftmals moglich, eine bestimmte Daten- 
5 verarbeitungsauf gabe selbst auf unterschiedliche Weise 
durchzufuhren. So ist etwa eine Reihe von Algorithmen be- 
kannt, die es erlauben, einen Satz Daten auf unterschiedliche 
Weise zu sortieren. Auch hier ist es erf orderlich, zwischen 
unterschiedlichen Algorithmen, die prinzipiell geeignet sind, 

10 eine bestimmte Datenverarbeitungsaufgabe zu bewaltigen, auf- 
grund von objektivierbaren Kriterien zu wahle'n. Dafi diese 
Wahl zur Laufzeit und/oder davor erfqlgen kann f sei erwahnt. 
Insgesamt ist es somit wiinschenswert, Auswahlmoglichkeiten 
bei der Datenverarbeitung mit konf igurierbaren multidimensio- 

15 nalen Prozessorf eldern zu verbessern, etwa urn bei 

festgespeicherten Konfigurationen sicherzustellen, dafi eine 
bereits anwendungszweckoptimierte Auswahl getroffen wurde. 

Die vorliegende Erfindung schlagt somit in einem ersten 
20 Grundgedanken ein Verfahren zur Auswahl eines aus einer Viel- 
zahl von Wegen zur Erzielung eines 

Datenverarbeitungserqebnisses bei der Datenverarbeitung unter 
zumindest moglicher Verwendung multidimensionaler Felder kon- 
figurierbarer Datenhandhabungselemente vor, bei welchem 
25 vorgesehen ist, dafi den Da tenhandhabungs element en konfigura- 
. tionsabhahgig verbraiichsbezogene kennzeichnende Grofien 
zugeordnet werden und eine Wegauswahl anhand der Zuordnung 
erfolgt. 

30 Ein weiterer Grundgedanke kann somit in der Erkenntnis gese- 
hen werden, dafi bestimmten Datenverarbeitungswegen typische 
Leistungs- bzw. Energieaufnahmewerte zugeordnet werden kon- 
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nen, um dann eine Wegauswahl unter Beriicksichtigung derselben 
vorzunehmen. Als Erzielung eines Datenverarbeitungsergebnis- 
ses wird auch eine bestimmte Art und Weise einer 
Zwischenergebnisberechnung und/oder einer Datenhandhabung 
5 etc. betrachtet. Durch die Zuordnung verbrauchskennzeichnen- 
der GroBen wird also' eine wesentliche Ojektivierung der 
Wegauswahl moglich. 

Die Auswahl eines Weges kann beispielsweise die Wahl eines 
10 gegebenen Algorithmus aus einer Vielzahl unterschiedlicher 
Algorithmen umfassen, sei es fur-Aufgaben wie das Sortieren 
von Daten, bestimmte mathematische Trans format ionen oder der- 
gleichen. Liegen in einer Programmmodul-Bibliothek etwa 
mehrere Sortieralgorithmen, Algorithmen zur Bestimmung einer 
15 Fourier-Transformierten oder dergleichen vor, so kann z. B. 
zu jeder eine verbrauchskennzeichnende Grofie ermittelt werden 
und es wird dann unter Beriicksichtigung derselben eine Aus- 
wahl vorgenommen. So wird es mSglich, Algorithmen zu wahlen, 
die beispielsweise einen besonders niedrigen Energieverbrauch 
20 besitzen. Dies kann fur mobile Anwendungen wie bei Laptops, 

Funktelef onen und dergleichen sinnvoll sein, • bietet aber auch 
in Bereichen Vorteile, bei' denen seh'r rechenintensive Aufga- 
ben zu bewaltigen sind, etwa in Servern, Basestations usw. , 
wo die in einer Verarbeitungseinheit erzeugte Leistung wegge- 
25 kvihlt und/oder abgefiihrt werden mufi. Durch die Erfindung 

kQnnen so Systemgesamtkosten minimiert werden. Auch kann etwa 
ein Place&Route-Algorithmus die Optimierung ausnutzen, etwa 
zur Erzielung niederenergetischer Andrdnungen. Dies ist be- 
sonders bevorzugt und wird als fur. sich erfinderisch 
30 angesehen. 
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Es ist weiter moglich, fur ein unci denselben Algorithmus eine 
Vielzahl unterschiedlicher Konf igurationen vorzusehen, etwa 
unter Berticksichtigung verschiedener, simultan und/oder se- 
quenziell auf das multidimensionale Feld zu konfigurierender 
5 " Teilaufgaben, und dann eine Auswahl aus diesen unter Auswer- 
tung der jeweils zucfeordneten Grofie vorzunehmen. 

Weiter ist es moglich, unter Anwendung des erf indungsgemafien 
Verfahrens dartiber zu befinden, ob eine gegebene Aufgabe der 

10 Datenverarbeitung, bzw. eine Teilaufgabe, dem betrachteten 

multidimensionalen .Feld konf igurierbarer Datenhandhabungsele- 
mente und/oder einem anderen Element zur Datenverarb.eitung 
aufierhalb des multidimensionalen Feldes zugeordnet werden 
soil; so kann etwa dartiber entschieden werden, ob dann, wenn 

15 das multidimensionale Feld als Koprozessor dient, eine be- 
stimmte Teilaufgabe besser auf einer rein sequenziell 
arbeitenden CPU oder dem rekonf igurierbaren, typisch als Da- 
tenf luJiprozessor oder dergleichen arbeitenden 
multidimensionalen Feld abgearbeitet werden soli. Es ist auch 

20 moglich, iiber das Erfordernis oder die Sinnhaftigkeit dedi- 
zierter Schaltkreise wie ASICs fur bestimmte. Aufgaben zu 
befinden. 

Typisch wird es sich bei dem Feld konf igurierbarer Datenhand- 
25 habungselemente urn ein zweidimensionales Feld handeln. Es sei 
erwahnt, dafi die Erfindung ftir Felder wie FPGAs, XPP-Prozes- 
soren usw. anwendbar ist. Es ist besonders bevorzugt fur zur 
Laufzeit konfigurierbare, insbesondere partiell zur Lauf zeit 
ohne Storung nicht umzukonifigurierende Elemente teil-rekon- 
30 f igurierbarer Prozessorf elder. 
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In typischen Anwendungen wie bei XPP-Feldern werden als zu 
berucksichtigende Datenhandhabungselemente insbesondere zu- 
mindest einige, bevorzugt alle der Elemente Busse, Register, 
ALUs, RAMs, I/O-Ports sowie konf igurierende Einheiten (CT's) 
5 erfafit. Es sei darauf hingewiesen, dafi von bestimmten dieser 
Telle nur eine abgeschatzte oder partielle Verbrauchsberiick- 
sichtigung erforderlich ist; so brauchen etwa bei Bussen 
lediglich bestimmte Treiberstufen und dergleichen beriicksich- 
tigt werden. Weiter kann es erforderlich sein, auch 
10 Taktbeschaltungen mit zu erfassen, sei es, weil in bestimmten 
Datenverarbeitungswegen eine Voll- oder Teilabschaltung eines 
Taktzweiges moglich ist, sei es, weil bestimmte Schaltungsbe- 
reiche mit einem unterschiedlichen Takt versorgt werden 
konnen oder miissen. 

15 

Es ist bevorzugt, wenn der kennzeichnende Wert nur grob abge- 
schatzt wird, etwa dahingehend, dafi festgestellt wird, ob ein 
bestimmtes Element momentan verwendet wird und/oder konfigu- 
riert ist, oder ob es stattdessen nicht verwendet wird und 

20 gegebenenfalls sogar von einer Spannungsversorgung bis auf 
einen Wake-up-Schaltkreis und/oder von einer Taktversorgung 
zumindest weitgehend abgeklemmt ist. Es ist also nicht erfor- 
derlich, eine absolut exakte Verbrauchskennzeichnung . 
vorzunehmen, etwa unter. Festlegurig des Verbraiichs der spezi- 

25 fischen algebraischen Operation, die einer jeweiligen 

arithmetisch-logischen Einheit aktuell und/oder dauerhaft zu- 
geordnet wird. Vielmehr kann es ausreichend sein, die 
verbrauchs kennzeichnende Grolie nur dahingehend zu bes.timmen, 
ob und wie weit tatsachlich das jeweilige Element im Augen- 

30 blick verwendet wird. Ausnahmen hiervpn sind mdglich, Eine 

Ausnahme kann insbesondere gemacht werden fur Operationen wie 
Multiplikationen, bei denen sehr grolie Schaltkreisflachen mit 
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Leistung versorgt werden miissen. In einem solchen Fall kann 
eine weitere Detaillierung vorgesehen werden, 

Es ist moglich und bevorzugt, jedem unterschiedlichen Daten- 
5 handhabungselement unterschiedliche Kennzahlen, wie strom- 
und/oder leistungsau'fnahmebezogener Groflen als verbrauchs- 
kennzeichnende GroBen zuzuordnen. Dieses kann gegebenenfalls 
in taktabhangiger Weise (Leistungsaufnahme pro Taktf requenz) 
geschehen. Weiter ist es moglich, eine Auswahl unter Beriick- 
10 sichtigung eines Summenwertes vorzunehmen, also tiber die 

Betrachtung des Gesamtverbrauchs oder abgeschatzten Gesamt- 
verbrauchs eines betrachteten Weges zu entscheiden. 

Die Auswahl wird typisch nicht alleine unter Berucksichtigung 
15 der verbrauchskennzeichnenden Grofien erfolgen, sondern kann 
andere Parameter miterfassen, etwa eine erforderliche Ausfiih- 
rungszeit, erforderliche Ressourcen auf einem 
multidimensionalen Feld, eine aktuelle oder erwartete Prozes- 
sorauslastung durch andere Aufgaben und/oder eine aktuell 
20 gewunschte beziehungsweise erwartete oder zulassige Lei- 
stungsaufnahme. Die Kennzahlen sind durch Meiiwerte und/oder 
Hardware- bzw. Syntheseanalysen .erhaltlieh und insbesondere 
in Look-Up-Tabeilen hinterlegbar . 

Die Auswahl des jeweiligen Weges kann vor der eigentlichen 
Datenverarbeitung erfolgen, etwa bei der Festlegung von spa- 
ter zu ladenden Konf igurationen unter mehreren, theoretisch 
implementierbaren Konf igurationen. In einem solchen Fall ist 
es besonders ist bevorzugt, wenn die kennzeichnende Grofie 
wahrend der Simulation der Datenverarbeitungsfunktionen mit 
ermittelt wird. Alternativ kann vorgesehen werden, dafi die 
Auswahl unter verschiedenen mSglichen Wegen wahrend der Lauf- 
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zeit erfolgt. In einem solchen Fall werden etwa mehrere mog- 
liche Algorithmen, z. B. urn Daten zu sortieren, 
bereitgestellt, es wird dann abgefragt, wie viele einzelne 
Daten zu sortieren sind und wie gegebenenf alls der Ordnungs- 
5 grad dieser Daten ist und es wird erst danach eine Auswahl 
unter verschiedenen,' vorher bestimmten Algorithmen anhand der 
ihnen zugeordneten parametrierten Verbrauchskennzeichnungs- 
grofien wie der Gesamtleistungsaufnahme usw. vorgenommen. 
Analog kann auch eine Konf iguration zur Lauf zeit abhangig von 
10 z. B. einer momentan moglichen oder gewiinschten Stromaufnahme 
erfolgen. 

Dieser Aspekt der Erfindung wird im folgenden nur beispiels- 
weise beschrieben, ohne dafi Bezug genommen wird auf eine 

15 

Figur . 

Es wird zunachst eirie gewtinschte Art der Daten-Bearbeitung 
festgelegt, die auf dem Prozessorf eld durchgefuhrt werden 

20 soil. Beispielsweise wird ein Viterbi-Algo'rithmus program- 
miert und eine fur das betrachtete Prozessorf eld geeignete 
Konf iguration bestimmt. Es wird dann ermittelt, welche Ein- 
heiten auf dem Prozessorfeld verwendet werden und tiber wie 
viele Takte dies geschieht. Bei der Betrachtung der verwende- 

25 ten Elemente werden in einem Beispiel berxicksichtigt ALUs, 

Vorwarts- und Riickwarts-Register (FREG und BREG) sowie Schal- 
ter in Bus sen (LSW und RSW) . Es wird dann der gesamte 
Energieverbrauch je Elementart bestimmt und anschliefiend der 
gesamte Energieverbrauch aller unterschiedlichen Einheiten. 

3*0 Die Energieverbrauchswerte fur ein- einzelnes Element je Takt 
sind ihrerseits abgeschatzt aus Simulationen der Hardware- 
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schaltungen bei der betrachteten Architektur unci sind fur das 
Verfahren der Erfindung tabellarisch hinterlegt. 

In dem betrachteten praktischen Beispiel sind fur die Imple- 
5 mentierung eines gegebenen Viterbi-Algorithmus 10 ALUs, 17 
Vorwartsregister, 23 Ruckwartsregister sowie 30 Busschalter 
(LSW) in einer und 35 Schalter in der entgegengesetzten Rich- 
tung (RSW) erf orderlich. Bei einem Energieverbrauch von 4,85 
pW/Hz je ALU, 7,01 pW/Hz pro FREG, 7,02 pW/Hz je BREG sowie 
10 2,03 pW/Hz je Busschalter ergibt sich folgende Tabelle: 

Number of cycles: 1582 

Energy consumption 

15 

Einzelkennzahl Gesamtkennzahl 



ALU: 


10„00 


X 


4,85 




48,50 


FREG: 


17,00. 


X 


7,01 




119,17 


BREG: 


23,00 


X 


7,02 




161,46 


LSW: 


30,00 


1 

X 

! 


2,03 




60,90 


RSW: 


35,00 


i 

X 


2,03 




71,05 



Total: 461,08 pW/Hz 

25 

Es kann nun der Implementierung der Viterbi-Transformation 
ein Gesamtleistungsverbrauch von 461,08 pW/Hz z.ugeordnet wer- 
den und dieser so erhaltene Wert verglichen werden mit 
Werten, die bei anderen Algorithmen und/oder Kbnfigurationen 
30 erhalten werden und/oder durch dedizierte Schaltkreise wie 
ASICs zu erhalten sind. 
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Es sei nun erwahnt, dafi die Auswahl einer aus einer Vielzahl 
von Konf igurationen, auch dann sinnvoll sein kann, wenn das 
Datenverarbeitungslogikzellen- und/oder, hier gleichbedeu- 
tend, Mischfeld aus analogen und/oder digitalen Zellen (wie 
5 beschrieben) an eine insbesondere sequentielle CPU angekop- 
pelt ist. 

Ein Problem bei herkommlichen Ansatzen zu rekonf igurierbaren 
Technologien besteht dann aber oft, wenn die Datenverarbei- 
10 tung primar auf einer sequenziellen CPU unter Hinzuziehung 
eines konf igurierbaren Datenverarbeituncjslogikzellenf eldes 
oder dergleichen erfolgen soil und/oder eine Datenverarbei- 
tung gewiinscht ist, in der viele und/oder umfangreiche 
sequenziell auszufuhrende Verarbeitungsschritte vorliegen. 

15 

Es sind Ansatze bekannt, die sich damit befassen, wie eine 
Datenverarbeitung sowohl auf einem konf igurierbaren Datenver- 
arbeitungslogikzellenfeld als auch auf einer CPU erfolgen 
kann. 

20 

So ist aus der WO 00/49496 ein Verfahren zum Ausfiihren eines 
Computerprogranimes mit einem Prozessor bekannt, der eine kon- 
figurierbare funktionelle Einheit umfasat, die in der Lage 
ist, rekonfigurierbare Anweisungen auszufuhren, deren Effekt 

25 zur Laufzeit durch Laden eines Konf igurationsprogrammes rede- 
finiert werden kann, wobei das Verfahren die Schritte 
umfasst, dafi Kombinationen rekonf igurierbarer Anweisimgen 
ausgewahlt, ein respektives Konfigurationsprogramm fiir jede 
Kombination erzeugt und das Computerprogramm ausgeftihrt wird. 

30 Dabei soil jedes Mai, wenn eine Anweisung aus einer der Kom- 
binationen wahrend der Ausfuhrung gebraucht wird und die 
konfigurierbare funktionelle Einheit nicht mit dem Konfigura- 
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tionsprogramm fiir diese Kombination konf iguriert ist, das 
Konfigurationsprogramm fiir alle der Anweisungen der Kombina- 
tion in die konf igurierbare funktionelle Einheit geladen 
werden. Weiter ist aus der WO 02/50665 Al eine Datenverarbei- 
5 tungsvorrichtung mit einer konf igurierbaren funktionellen 
Einheit bekannt, wobei die konf igurierbare funktionelle Ein- 
heit dazu dient, eine Anweisung gemali einer konf igurierbaren 
Funktion auszufuhren. Die konf igurierbare funktionelle Ein- 
heit weist eine Vielzahl von unabhangigen konf igurierbaren 

10 Logikblocken zum Ausfiihren prograirauierbarer Logikoperationen 
auf, um die konf igurierbare Funktion zu implement ieren. Kon- 
figurierbare Verbindungsschaltkreise sind zwischen den 
konfigurierbaren Logikblocken und sowohl den Eingangen als 
auch den Ausgangen der konfigurierbaren funktionellen Einheit 

15 vorgesehen. Dies erlaubt eine Optimalisierung der Verteilung 
von Logikfunktionen ttber die konfigurierbaren Logikblocke. 

Ein Problem bei herkommlichen Architekturen besteht auch 
dann, wenn eine Ankopplung erfolgen soli und/oder Technologi- 

20 en wie Datastreaming, Hyperthreading, Multithreading und so 
weiter in sinnvoller und Performance steigernder Weise ausge- 
nutzt werden sollen. Die beispielhaft erwShnte Technologie 
der vorzitierten Nicht-Anmelder-Dokumente zeigt etwa eine An- 
ordnung, bei der zwar Konf iguratlonen in ein konfigurierbares 

25 Datenverarbeitungslogikzellenfeld geladen werden konnen, bei 
welchen allerdings der Datenaustausch zwischen der ALU der 
CPU und dem konfigurierbaren Datenverarbeitungslogikzellen- 
feld, sei es ein FPGA, DSP oder dergleichen, uber die 
Register erfolgt. Mit anderen Worten miissen Daten aus einem 

30 Datenstrom zunachst sequenziell in Register geschrieben wer- 
den und dann sequenziell wieder in diesen abgelegt werden. 
Auch ist ein Problem dann gegeben, wenn ein Zugriff auf Daten 
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von extern erfolgen soil, da selbst dann noch Probleme beim 
zeitlichen Ablauf der Datenverarbeitung im Vergleich zur ALU 
und bei der Zuweisung von Konfigurationen und so weiter be- 
stehen. Die herkommlichen Anordnungen, wie sie aus den Nicht - 
5 Anmelder-eigenen Schutzrechten bekannt sind, werden unter an- 
derem dazu verwendet', Funktionen im konf igurierbaren 
Datenverarbeitungslogikzellenfeld, DFP, FPGA oder dergleichen 
abzuarbeiten, die nicht effizient auf der CPU-eigenen ALU ab- 
zuarbeiten sind. Damit wird das konf igurierbare 
10 Datenverarbeitungslogikzellenfeld praktisch verwendet, um be- 
nutzerdefinierte Opcodes zu ermoglichen, die eine 
effizientere Abarbeitung von Algorithmen ermoglichen, als 
.dies auf dem ALU-Rechenwerk der CPU ohne konf igurierbare Da-' 
tenverarbeitungslogikzellenfeldunterstutzung moglich ware. 

15 

Im Stand der Technik ist, wie erkannt wurde, die Ankopplung 
demnach im Regelfall wortbasiert, nicht jedoch blockbasiert, 
wie es zur datenstromenden Verarbeitung erforderlich ware. Es 
ist zunachst wiinschenswert, eine effizientere Datenverarbei- 
20 tung zu ermOglichen, als dies mit einer engen Ankopplung uber 
Register der Fall ist. 

Eine weitere Moglichkeit zur Verwendung von Logikzellenfel- 
dern aus grob- und/oder feirigranular gebaiiten Logikzellen und 

25 Logikzellenelementen besteht in einer sehr losen Ankopplung 
eines solchen Feldes an eine herkommliche CPU und/oder ein 
CPU-Kern bei eingebetteten Systemen. Hierbei kann ein her- 
kommliches, sequenzielles Programm auf einer CPU oder 
dergleichen laufen, beispielsweise ein in C, C++ oder der- 

30 gleichen geschriebenes Programm, wobei von diesem Aufrufe 

einer Datenstromverarbeitung auf dem fein- und/oder grobgra- 
nularen Datenverarbeitungslogikzellenfeld instantiiert 
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werden. Problematisch ist dann, dass beim Programmieren fur 
dieses Logikzellenfeld ein nicht in C oder einer anderen se- 
quenziellen Hochsprache geschfiebenes Programm fur die 
Datenstromabarbeitung vorgesehen werden muss. Erwiinscht ware 
5 hier, dass sowohl auf der herkommlichen CPU-Architektur als 
auch auf einem mit diesen gemeinsam betriebenen Datenverar- 
beitungslogikzellenfeld C-Programme oder dergleichen 
abzuarbeiten sind, das heifit, dass insbesondere mit dem Da- 
tenverarbeitungslogikzellenfeld in quasi sequenzieller 
10 Programmabarbeitung dennoch eine Datenstromfahigkeit erhalten 
bleibt, wahrend simultan auch insbesondere mog.lich bleibt, 
dass ein CPU-Betrieb in nicht zu loser Ankopplung mSglich 
ist. Es ist auch bereits bekannt, innerhalb einer Datenverar- 
beitungslogikzellenfeldanordnung, wie sie insbesondere aus 
15 PACT 02 (DE 196 51 075.9-53, WO 98/26356), PACT 04 (DE 196 54 
846.2-53, WO 98/29952), PACT08, (DE 197 04 728.9, WO 
98/35299) PACT 13 (DE 199 26 538.0, WO 00/77652) PACT 31 (DE 
102 12 621.6-53, PCT/EP 02/10572) bekannt ist, auch eine se- 
quenzielle Datenverarbeituhg innerhalb des 
20 Datenverarbeitungslogikzellenfeldes vorzusehen. Hierbei wird 
dann allerdings innerhalb einer einzelnen Konf iguration, bei- 
spielsweise um Ressourcen zu sparen, eine Zeitoptimierung zu 
erzielen und so weiter, eine partielle Abarbeitung erzielt, 
ohne dass diese bdreits dazu fuhrt, dass ein Programmierer 
25 ein Stuck Hochsprachencode automatisch leicht ohne weiteres 
auf ein Datenverarbeitungslogikzellenfeld umsetzen kann, wie 
dies bei herkommlichen Maschinenmodellen far sequenzielle 
Prozessoren der Fall ist. Die Umsetzung von Hochsprachencode 
auf Datenverarbeitungslogikzellenfelder nach Prinzipien der 
30 Modelle fur sequenziell arbeitende Maschinen ist weiterhin 
schwierig. 
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Aus dem Stand der Technik ist weiter bekannt, dass mehrere 
Konfigurationen, die eine jeweils unterschiedliche Funktions- 
weise von Arrayteilen bewirkeri, simultan auf dem 
Prozessorfeld (PA) abgearbeitet werden konnen und dass ein 
5 Wechsel von einer oder einigen der Konf iguration (en) ohne 

St5rung anderer zur Laufzeit erfolgen kann. Es sind Verfahren 
und in Hardware implement ierte Mittel zu deren Umsetzung be- 
kannt, wie sichergestellt werden kann, dass dabei ein 
Abarbeiten von auf das Feld zu ladenden Teilkonf igurationen 
10 ohne Deadlock erfolgen kann. Verwiesen wird hierzu insbeson- 
dere auf die die Filmo-Technik betreffenden Anmeldungen 
PACT 05 (DE 196 54 593.5-53, WO 98/31102) PACT10 (DE 198 07 
872.2, WO 99/44147, WO 99/44120) PACT 13 (DE 199 26 538.0, WO 
00/77652), PACT 17 (DE 100 28 397.7, WO 02/13000). Diese Tech- 
15- nologie ermoglicht in gewisser Weise bereits eine 

Parallelisierung und, bei entsprechender Gestaltung und Zu- 
ordnung der Konfigurationen, auch eine Art - 
Multitasking/Multithreading und zwar dergestalt, dass eine 
Planung, das- heifit ein Scheduling und/oder eine Zeitnutzungs- 
20 planungssteuerung vorgesehen ist. Es sind also aus dem Stand 
der Technik schon Zeitnutzungsplanungssteuerungsmittel und - 
verfahren per se bekannt, die, zumindest unter entsprechender 
Zuordnung von Konfigurationen zu einzelnen Aufgaben und/oder 
Fa'den zu Konfigurationen und/oder Konf igurationsf olgen, ein 
25 Multitasking und/oder Multithreading erlauben. Die Verwendung 
solcher Zeitnutzungsplanungssteuermittel, die im Stand der 
Technik zur Konf igurierung und/oder Konfigurationsverwaltung 
verwendet wurden, zu Zwecken des Scheduling von Tasks., 
Threads, Multi- und Hyperthreads wird per se als erfinderisch 
30 angesehen. 
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Wunschenswert ist auch zumindest gemafi einem Teilaspekt in 
bevorzugten Varianten, moderne Technologien der Datenverar- 
beitung und Programmabarbeitung wie Multitasking, 
Multithreading, Hyperthreading untersttitzen zu konnen, zumin- 
5 dest in bevorzugten Varianten einer Halbleiterarchitektur . 

Ein weiterer wesentlicher Aspekt der vorliegenden Erfindung 
ist somit darin zu sehen, dass dem Datenverarbeitungslo- 
gikzellenfeld Daten im Ansprechen auf die Ausfuhrung einer 

10 Ladekonfiguration durch das Datenverarbeitungslogikzellenf eld 
zugefiihrt werden und/oder Daten aus diesem Datenverarbei- 
tungslogikzellenf eld weggeschrieben (STORE) werden, indem 
eine STORE-Konf iguration entsprechend abgearbeitet wird. Die- 
se Lade- und oder Speicherkonf igurationen sind dabei 

15 bevorzugt derart auszugestalten, dass innerhalb des Datenver- 
arbeitungslogikzellenfeldes und/oder einer anderen Einheit 
wie einer RISOArchitektur direkt oder indi'rekt Adressen je- 
ner Speicherstellen generiert werden, auf welche ladend 
und/oder speichernd direkt oder indirekt zugegriffen werden 

20 soli. Es ist durch diese Einkonf iguration von Adressgenerato- 
ren innerhalb einer Konf iguration moglich, eine Vielzahl von 
Daten in das Datenverarbeitungslogikzellenfeld einzuladen, wo 
sie gegebenenfalls in internen Speichern (iRAM) ablegbar sind 
und/oder wo sie in internen Zellen wie EALUs mit Registern 

25 und/oder dergleichen eigenen Speichermitteln abgelegt werden 
konnen. Die Lade- beziehungsweise Speicherkonf iguration er- 
moglicht somit ein blockweises und nahezu datenstromartiges r 
insbesondere gegeniiber Einzelzugrif f vergleichsweises schnel- 
les Laden von Daten und es kann eine solche Lade-Kohf igura- 

30 tion ausgefuhrt werden vor einer oder mehreren tatsachlich 

Daten auswertend und/oder verandernd abarbeitenden Konfigura- 
tion(en), mit welcher/n die vorab geladenen Daten verarbeitet 
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werden. Das Datenladen kann dabei typisch bei groBen Logik- 
zellenf eldern in kleinen Teilbereichen derselben geschehen, 
wahrend andere Teilbereiche mit anderen Aufgaben befafit sind. 
Bei der in anderen verof fentlichten Dokumenten des Anmelders 
5 beschriebenen Ping-Pong-artigen Datenverarbeitung, bei der 
auf beiden Seiten eines Datenverarbeitungsf eldes Speicherzel- 
len vorgesehen sind, wobei die Daten in einem ersten 
Verarbeitungsschritt von dem Speicher auf der einen Seite 
durch das Datenverarbeitungsf eld zum Speicher auf der anderen 

10 Seite stromen, dort die beim ersten Felddurchstromen erhalte- 
nen Zwischenergebnisse im zweiten Speicher abgelegt werden, 
gegebenenfalls das Feld umkonf iguriert wird, die Zwischener- 
gebnisse dann fur die Weiterverarbeitung zurtickstromen usw., 
kann etwa eine Speicherseite durch eine LOAD-Konfiguration in 

15 einem Array-Teil mit neuen Daten vorgeladen werden, wahrend 
aus der gegenuberliegenden Speicherseite Daten mit einer 
STORE-Konfiguration in einem anderen Array-Teil weggeschrie- 
ben werden. Dieses simultane LOAD/STORE -Vorgehen ist im 
ubrigeh auch ohne raumliche Speicherbereichstrennung moglich. 

20 

Das Laden kann insbesondere aus einem Cache und in diesen 
'. hinein erfolgen. Dies hat die Vorteile, dass die externe Kom- 
munikation mit grofieren Speicherbanken iiber den 
Cachecontroller gehandhabt wird, ohne dass innerhalb des Da- 

25 tenverarbeitungslogikzellenfeldes separate Schaltanordnungen 
dafUr vorgesehen sein mussen, dass der Zugriff in lesender 
oder schreihender Weise bei Cache-Speichermitteln typisch 
sehr schnell und mit allenfalls geringer Latenzzeit erfolgen 
wird und dass auch typisch eine CPU-Einheit, dort typisch 

30 iiber eine separate LOAD/STORE-Einheit, an diesen Cache ange- 
bunden ist, sodass ein Zugriff auf Daten und ein Austausch 
derselben zwischen CPU-Kern und Datenverarbeitungslogikzel- 
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lenfeld blockweise schnell unci derart erfolgen kann f dass 
nicht fur jedes Ubergeben von Daten ein separater Befehl etwa 
aus dem OpCode-Fetcher der CPU abgeholt und verarbeitet wer- 
den muss. 

5 

Es erweist sich diese Cacheankoppelung auch als wesentlich 
giinstiger als eine Ankopplung eines Datenverarbeitungslo- 
gikzellenfeldes an die ALU iiber Register, wenn diese Register 
nur iiber eine LOAD/STORE-Einheit mit einem Cache kommunizie- 
10 ren, wie dies aus den Nicht-PACT-eigenen zitierten Schriften 
per se bekannt ist. 

Es kann eine weitere Datenverbindung zu der Lade/Speicher- 
einheit der oder einer dem Datenverarbeitungslogikzellenfeld 
15 zugeordneten Sequenziell-CPU-Einheit vorgesehen sein und/oder 
zu deren Register. 

Es sei erwahnt, dass ein Ansprechen derartiger Einheiten iiber 
separate Eingangs-/Ausgangsanschliisse (IO-Ports) der insbe- 
20 sondere als VPU beziehungsweise XPP ausgestaltbaren 

Datenverarbeitungslogikzellenanordnung erfolgen kann und/oder 
durch einen oder mehrere einem Einzelport nachgeschaltete 
Multiplexer. 

25 Dass neben dem insbesondere blockweisen und/oder streamenden 
und/oder im Random^Access, insbesondere im RMW-Modus (Read- 
Modify-Write-Modus) erfolgenden Zugriff auf Cache-Bereiche in 
schreibender und/oder lesender Weise und/oder die LOAD/STORE- 
Einheit und/oder die (per se im Stand der Technik bekannte) 

30 Verbindung mit dem Register der Sequenziell-CPU auch eine 
Verbindung mit einem externen Massenspeicher wie einem RAM, 
einer Festplatte und/oder einem anderen Datenaustauschport 
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wie einer Antenne und so weiter erfolgen kann, sei auch er- 
wahnt. Es kann fur diesen Zugriff auf Cache- und/oder LOAD/ 
STORE-Einheit- und/oder registereinheitverschiedene Speicher- 
mittel ein separater Port vorgesehen sein. Dass hier 
5 geeignete Treiber, Signalaufbereiter fur Pegelanpassung und 
so weiter vorgesehen* sein konnen, sei erwahnt. Im Obrigen sei 
erwahnt, dass insbesondere, jedoch nicht ausschlieBlich zur 
Aufbereitung eines in das Datenverarbeitungslogikzellenf eld 
hineinstromenden Oder in diesem stromeriden Datenstrom die Lo- 
10 gikzellen des Feldes ALUs bzw. EALUs umfassen konnen und 

typisch werden, 4enen eingangs- und/oder ausgangsseitig, ins- 
besondere sowohl eingangs- als auch ausgangsseitig kurze, 
feingranular konf igurierbare, FPGA-artige Schaltkreise vorge- 
setzt sein konnen, um etwa aus einem kontinuierlichen 
15 Datenstrom Vierbitblocke herauszuschneiden, wie dies fur die 
MPEG-4-Dekodierung erforderlich ist. Es ist dies zum einen 
vorteilhaft, wenn ein Datenstrom in die ZelTe hineingelangeri 
soil und dort ohne Blockierung von grofieren PAE-Einheiten ei- 
ner Art Vorverarbeitung zu unterwerfen ist. Dies ist auch 
20 dann von ganz besonderem Vorteil, wenn die ALU als SIMD- 

Rechenwerk ausgestaltet wird, wobei dann ein sehr breites Da- 
t'eneingangswort von zum Beispiel 32 Bit Datenbreite fiber die 
vorgeschalteten zB FPGA-artigen Streifen aufgespalten wird in 
mehrere parallele Datenworter von. zum Beispiel 4 Bit Breite, 
25 die dann in den SIMD-Rechenwerken parallel abgearbeitet wer- 
den konnen, was die Gesamtperformance des Systems signifikant 
zu erhohen vermag, sofern entsprechende Anwendung bendtigt 
werden. Es sei darauf hingewieseh, dass vorstehend von FPGA- 
artigen vor- beziehungsweise nachgeschalteten Strukturen die 
30 Rede war. Mit FPGA-artig iriuss aber, was explizit erwahnt sei, 
nicht zwingend Bezug genommen sein. auf 1-Bit-granulare Anord- 
nungen. Es ist insbesondere moglich, statt dieser 
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hyperfeingranularen Strukturen lediglich feiner granulare 
Strukturen von zum Beispiel 4 Bit Breite vorzusehen. Das 
heifit, die FPGA-artigen Eingarigs- und/oder Ausgangsstrukturen 
vor und/oder nach einer insbesondere als SIMD-Rechenwerk aus- 
gestalteten ALU-Einheit sind so konf igurierbar, dass immer 4 
Bit breite Datenworter zugefuhrt und/oder verarbeitet werden. 
Es ist moglich, hier eine Kaskadierung vorzusehen, so dass 
zum Beispiel die einkommenden 32 Bit breiten Datenworter in 4 
separierte bzw. separierende 8-Bit-FPGA-artige, nebeneinander 
angeordnete Strukturen stromen, diesen 4 Stuck 8 Bit breiten 
FPGA-artigen Strukturen ein zweiter Streifen mit 8 Stuck 4 
Bit breiten FPGA-artigen Strukturen nachgesetzt ist, und ge- 
gebenenfalls nach einem weiteren derartigen Streifen dann, 
sofern dies fur den jeweiligen Zweck als erforderlich erach- 
tet wird, zum Beispiel 16 Stuck parallel nebeneinander 
angeordnete 2 Bit breite FPGA-artige Strukturen vorgesehen 
werden. Wenn dies der Fall ist, kann gegenurber rein hyper- 
feingranular FPGA-artigen Strukturen eine betrachtliche 
Verringerung des Konfigurationsaufwandes erzielt werden. Dass 
dies uberdies dazu fixhrt, dass der Konf igurationsspeicher und 
so weiter der FPGA-artigen Struktur wesentlich kleiner aus- 
f alien kann und somit eine Einsparung an Chipflache erzielt 
wird, sei erwahnt. 

Prinzipiell sind die vorstehend beschriebenen Kopplungsvpr- 
teile bei Datenblpckstromen uber den Cache prinzipiell 
erreichbar; besonders bevorzugt ist es jedoch, wenn der Cache 
streifenweise (slice-artig) aufgebaut ist und dann ein Zu- 
griff auf mehrere der Slices simultan erfolgen kann, 
insbesondere auf alle Slices gleichzeitig. Dies ist dann vor- 
teilhaft, wenn, was noch erortert werden wird, auf dem 
Datenverarbeitungslogikzellenfeld (XPP) und/oder der Sequen- 
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ziell-CPU und/oder den Sequenziell-CPUs eine Vielzahl von 
Threads abzuarbeiten sind, sei es im Wege des Hyperthrea- 
dings, des Multitaskings und/oder des Multithreadings. Es 
sind also bevorzugt Cachespeichermittel iuit Scheibenzugrif f 
5 bzw. Scheibenzugrif fsermoglichungssteuermitteln vorgesehen. 
Es kann dabei z. B. 'jedem Thread eine eigene Scheibe zugeord- 
net werden. Dies ermoglicht es spater, beim Abarbeiten der 
Threads sicherzustellen, dass jeweils auf die entsprechenden 
Cachebereiche bei Wiederaufnahme der mit dem Thread abzuar- 
10 beitenden Bef ehlsgruppe zugegriffen wird. 

Es sei noch einmal erwahnt, dass der Cache nicht zwingend in 
Slices unterteilt sein muss, und dass, wenn dies der Fall 
ist, nicht zwingend jeder Slice einem eigenen Thread zugewie- 

15 sen werden muss. Es sei allerdings darauf hingewiesen, dass 
dies die bei weitem bevorzugte Methode ist. Es sei weiter 
darauf hingewiesen, dass es Falle geben kann, in denen nicht 
alle Cache-Bereiche simultan oder zu einer gegebenen Zeit 
temporar bentitzt werden. Vielmehr ist zu erwarten, dass bei 

20 typischen Datenverarbeitungsanwendungen, wie sie in handge- 
haltenen mobilen Telefonen (Handys) f Laptops, Kameras und so 
weiter auftreten werden, haufig Zeiten vorliegen werden, in 
denen nicht der gesamte Cache benotigt wird. Es ist daher be- 
sonders bevorzugt f wenn einzelne Cache-Bereiche von der 

25 Leistungsversorgung derart trennbar sind, dass ihr Energie- 
verbrauch signifikant ^bsinkt, insbesdndere auf oder nahe 
null. Dies kann bei sliceweiser Ausgestaltung des Caches 
durch sliceweise Abschaltung derselben liber geeignete Lei- 
stungsabtrennmittel geschehen. Die Abtrennung kann entweder 

30 iiber eine Heruntertaktung-, Takt abtrennung oder- eine Lei- 
stungsabtrennung. erfolgen. Es kann insbesondere einer 
einzelnen Cache-Scheibe oder dergleichen eine Zugrif f serken- 
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nung zugeordnet sein, welche dazu ausgebildet ist, zu erken- 
nen, ob ein jeweiliger Cache-Bereich beziehungsweise eine 
jeweilige Cache-Scheibe momentan einen ihm zugeordneten 
Thread, Hyperthread oder Task hat, von welchem er benutzt 
5 wird. Sofern dann vom Zugrif f serkennungsmittel festgestellt 
wird, dass dies nicht der Fall ist, wird typisch eine Abtren- 
nung vom Takt und/oder sogar der Leistung moglich sein. Es 
sei erwahnt, dass bei Wiedereinschalten der Leistung nach ei- 
nem Abtrennen ein sofortiges Wiederansprechen des 
10 Cachebereiches moglich ist, also keine signifikante Verzoge- 
rung durch das An- und Ausschalten der Leistungszufuhr zu ■ 
erwarten ist, sofern mit gangigen geeigneten Halbleitertech- 
nologien eine Implementierung in Hardware erfolgt. 

15 Ein weiterer besonderer Vorteil, der sich bei der vorliegen- 
den Erfindung ergibt, besteht darin, dass zwar eine besonders 
effiziente Kopplung bezuglich des Obertrags* von Daten bezie- 
hungsweise Operanden in insbesondere blockweiser Form gegeben 
ist, dass aber dennoch ein Balancing nicht in der Weise er- 

20 forderlich ist, dass die exakt gleiche Verarbeitungszeit in 
Sequenziell-CPU und XPP beziehungsweise' Datenverarbeitungslo- 
gikzellenfeld erforderlich ist. Vielmehr erfolgt die 
Verarbeitung in einer praktisch oftmals unabhangigen Weise, 
insbesondere derart, dass. die Sequenziell-CPU und die Daten- 

25 verarbeitungslogikzellenfeldanordnung fur einen Scheduler 
oder dergleichen als. separate Ressourcen betrachtbar sind. 
Dies erlaubt eine sofortige Umsetzung bekannter Datenverar- 
beitungsprogrammaufspaltungstechnologien wie Multitasking, 
Multithreading und Hyperthreading . Der sich ergebende Vor- 

30 teil, dass ein Pfadbalancing nicht erforderlich ist, fuhrt 
dazu, dass beispielsweise in der Sequenziell-CPU beliebige 
Anzahlen von Pipeline.stuf en durchlaufen werden konnen, Tak- 
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tungen in unterschiedlicher Weise mogliche sind und so wei- 
ter. Ein weiterer Vorteil der vorliegenden Erfindung besteht 
darin, dass durch das Hineinkonf igurieren einer Ladekonf igu- 
ration beziehungsweise einer Storekonfiguration in das XPP 
5 oder andere Datenverarbeitungslogikzellenfelder die Daten in 
das Feld mit einer Geschwindigkeit hineingeladen werden oder 
aus diesem herausgeschrieben werden konnen, die nicht mehr 
bestimmt ist durch die Taktgeschwindigkeit der CPU, die Ge- 
schwindigkeit, mit welcher der OpCode-Fetcher arbeitet, oder 
10 dergleichen. Mit anderen Worten ist die Ablauf steuerung der 
Sequenziell-CPU nicht mehr f laschenhalsartig begrenzend fur 
den Datendurchsatz des Datenzellenlogikf eldes, ohne dass eine 
nur noch lose Ankopplung besteht. 

15 Wahrend es in einer besonders bevorzugten Variante der Erfin- 
dung mSglich ist, die fur eine XPP-Einheit bekannte CT (bzw. 
CM; Konfigurationsmanager bzw. Konf igurationstabelle) zu ver- 
wenden, um sowohl das Konfigurieren eines oder mehrerer, auch 
hierarchisch mit mehreren CTs angeordneter XPP-Felder und 

20 gleichzeitig eines oder mehrerer Sequenziell-CPUs, dort quasi 
. als Hyperthreading-Hardwareverwaltung /Scheduler zu verwen- 
den, was den inharenten Vorteil hat, dafi bekannte 
Technologien wie FILMO usw. fur die hardwareunterstiitzte Ver- 
walturig beim Hyperthreading einsetzbar werden,- ist es 

25 alternativ und/oder, insbesondere in hierarchischer Anord- 
nung, zusatzlich moglich, dass ein 

. Datenverarbeitungslogikzellenfeld wie eine XPP Konfiguratio- 
nen vom OpCode-Fetcher einer Sequenziell-CPU uber das 
Koprozessor-Interface erhalt. Dies fahrt dazu, dafi von der 
30- Sequenziell-CPU und/oder einer anderen XPP ein Aufruf instan- 
tiiert werden kann, der zu einer Datenabarbeitung auf der XPP 
ftthrt. Die XPP wird dabei dann z. B. uber die beschriebene 
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Cache-Ankopplung und/oder mittels LOAD- und/oder STORE - 
Konf igurationen, die Adressgeneratoren fur Laden und/oder 
Wegschreiben von Daten im XPP- bzw. Datenverarbeitungslo- 
gikzellenf eld vorsehen, im Datenaustausch gehalten. Mit 
5 anderen Worten wird eine Koprozessor-artige Ankopplung eines 
Datenverarbeitungslogikzellenfeldes moglich, wahrend gleich- 
zeitig ein datenstromartiges Datenladen durch Cache- und/oder 
I/O-Port-Kopplung erfolgt. 

10 Es sei erwahnt, dafi die Koprozessor-Ankopplung, d. h. die An- 
kopplung des Datenverarbeitungslogikzellenfeldes typisch dazu 
fuhren wird, dafi das Scheduling auch fur dieses Logikzellen- 
feld auf der Sequenziell-CPU oder einer dieser ubergeordneten 
Schedulereinheit bzw. einem entspfechenden Schedulermittel 

15 erfolgen wird. In einem solchen Fall findet praktisch die 
Threading-Kontrolle und -verwaltung auf dem Scheduler bzw. 
der Sequenziell-CPU statt. Obwohl dies per -se moglich ist, 
wird dies, zumindest bei einfachster Implementierung der Er- 
findung, nicht zwingend der Fall sein. Vielmehr kann eine 

20 Verwendung des Datenverarbeitungslogikzellenf eldes durch Auf- 
ruf in herkommlicher Weise wie bei einem Standard-Koprozessor 
etwa bei 8086/8087-Kombinationen erfolgen. 

Weiter sei erwahnt, dafi es in einer besonders bevorzugten Va- 
25 riante, unabhangig von der Art der Konf iguration, sei es uber 
das Koprozessor-Interface, den als Scheduler mitdienenden 
Konfigurationsmanager (CT) der XPP bzw. des Datenverarbei- 
tungslogikzellenf eldes oder dergleichen oder auf andere 
Weise, moglich ist, im bzw. unmittelbar am Datenverarbei- 
30 tungslogikzellenfeld bzw. unter Verwaltung des 

Datenverarbeitungslogikzellenf eldes Speicher, insbesondere 
interne Speicher, insbesondere bei der XPP-Archite.ktur, wie 
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sie aus den diversen Voranmeldungen und den Verof f entlichun- 
gen des Anmelders bekannt ist, RAM-PAEs, oder andere 
entsprechend verwaltete oder interne Speicher wie ein Vektor- 
register anzusprechen, d. h. die uber die LOAD-Konf iguration 
5 eingeladenen Datenmengen vektorartig wie in Vektorregistern 
in die internen Speicher abzulegen, dann, nach Umkonfigurie- 
ren der XPP bzw. des Datenverarbeitungslogikzellenf eldes, 
also Uberschreiben bzw. Nachladen und/oder Aktivieren einer 
neuen Konf iguration, die die eigentliche Verarbeitung der Da- 

10 ten durchfiihrt (in diesem Zusammenhang sei darauf 

hingewiesen, daft fur eine- solche Verarbeitungs konf iguration 
auch Bezug genommen werden kann auf eine Mehrzahl von Konfi- 
gurationen, die z. B. im Wave-Modus und/oder sequenziell 
nacheinander abzuarbeiten sind) zuzugreifen wie bei einem 

15 Vektorregister und dann die dabei erhaltenen Ergebnisse 
und/oder Zwischenergebnisse wiederum in die internen oder 
tiber die XPP wie interne Speicher verwalteten externen Spei- 
cher, um dort diese Ergebnisse abzulegen. Die so 
vektorregisterartig mit Verarbeitungsergebnissen beschriebe- 

20 nen Speichermittel unter XPP-Zugriff sind dann, nach 

Rekonfigurieren der Verarbeitungskonf iguration durch Laden 
der STORE-Konfiguration in geeigneter Weise weggeschrieben, 
was wiederum datenstromartig geschieht, sei es uber den I/O- 
Port direkt in externe Speicherbereiche und/oder, wie beson- 

25 ders bevorzugt, in Cache-Speicherbereiche, auf welche dann zu 
einem spateren Zeitpunkt die. Sequenziell-CPU und/oder andere 
Konfigurationen auf der zuvor die Daten erzeugt habenden XPP 
oder einer anderen entsprechenden Datenverarbeitungseinheit 
zugreifen konnen. 

30 

Eine besonders bevorzugte Variante besteht darin, zumindest 
fur bestimmte Datenverarbeitungsergebnisse. und/oder Zwischen- 
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ergebnisse als Speicher- bzw. Vektorregistermittel, in wel- 
chem bzw. welches die erhaltenen Daten abzulegen sind, nicht 
einen internen Speicher zu benutzen, in welchen Daten uber 
eine STORE-Konf iguration in den Cache- oder einen anderen Be- 
5 reich, auf welchen die Sequenziell-CPU oder eine andere 
Datenverarbeitungseinheit zugreifen konnen, wegzuschreiben 
sind, sondern statt dessen unmittelbar die Ergebnisse wegzu- 
schreiben in entsprechende, insbesondere zugrif f sreservierte 
Cachebereiche, die insbesondere Slice-artig organisiert sein 

10 konnen. Dies kann gegebenenfalls den Nachteil einer grofieren 
Latenz haben, insbesondere wenn die Wege zwischen der XPP- 
oder Datenverarbeitungslogikzellenfeldeinheit und dem Cache 
so lang sind, dafi die Signallauf zeiten ins Gewicht fallen, 
fuhrt aber dazu, dafi gegebenenfalls keine weitere STORE - 

15 Konf iguration benotigt wird. Es sei im ubrigen erwahnt, dafi 
eine derartige Abspeicherung von Daten in Cache-Bereiche ei- 
nerseits, wie vorstehend beschrieben, dadufch nioglich ist, 
dafi der Speicher, in welchen geschrieben wird, physikalisch 
nahe beim Cache-Controller liegt und als Cache ausgestaltet 

20 ist, dass aber alternativ und/oder zusatzlich auch die Mog- 
lichkeit besteht, einen Teil eines XPP-Speicherbereiches, 
XPP-internen Speichers oder dergleichen, insbesondere bei RAM 
uber PAEs unter die Verwaltung eines oder, nacheinahder meh- 
rerer Cache-Speichercontroller zu stellen. Dies hat dann 

25 Vorteile, wenn die Latenz beim Abspeichern der Verarbeitungs- 
ergebnisse, welche innerhalb des 

Datenverarbeitungslogikzellenfeldes bestimmt werden, gering 
gehalten werden soil, wahrend die Latenz beim Zugrif f auf den 
dann nur noch als „Quasi-Cache* dienenden Speicherbereich 
30 durch andere Einheiten nicht oder nicht signifikant ins Ge- 
wicht fallt. 
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Es sei im iibrigen erwahnt, dafi auch eine Ausgestaltung derart 
moglich ist, dafi der Cache-Controller einer herkommlichen Se- 
quenziell-CPU einen Speicherbereich als Cache anspricht, der, 
ohne dem Datenaustausch mit dem Datenverarbeitungs- 
5 logikzellenfeld zu dienen, auf und/oder bei diesem physika- 
lisch liegt. Dies hat den Vorteil, dafi dann, wenn Anwendungen 
auf dem Datenverarbeitungslogikzellenfeld laufen,. die einen 
allenfalls geringen lokalen Speicherbedarf haben, und/oder 
wenn auch nur wenige weitere Konf igurationen bezogen auf die 

10 zur Verfugung stehenden Speichermengen benotigt werden, diese 
einer oder mehreren Sequenziell-CPUs als Cache zur Verfugung 
stehen konnen. Es sei erwahnt, dafi dann der Cache-Controller 
fur die Verwaltung eines Cache-Bereiches mit dynamischem Urn- 
fang, d. h. variierender Grofie ausgebildet sein kann und 

15 wird. Eine dynamsiche Cache-Umf angs verwaltung bzw. Cache- 

Umfangsverwaltungsmittel fur die dynamische Cache-Verwaltung 
wird typisch die Arbeitslast auf der Sequenziell-CPU und/oder 
deni Datenverarbeitungslogikzellenfeld beriicksichtigen. Mit 
anderen Worten kann beispielsweise analysiert werden, wie 

20 viele NOPs in einer gegebenen Zeiteinheit auf der Sequenzi- 
ell-CPU vorliegen und/oder wie viele Konf igurationen im XPP- 
Feld in dafiir vorgesehenen Speicherbereichen ■ vorabgelegt sein 
sollen, urn eine schnelle Umkonf iguration, sei es im Wege ei- 
ner Wellenrekonfiguration oder auf andere Weise. Die hiermit 

25 offenbarte dynamische Cachegrosse ist dabei insbesondere be- 
vorzugt lauf zeitdynamisch, d, h . der Chacecontroller 
verwaltet jeweils eine aktuelle Cachegrosse, die sich von 
Takt zu Takt oder Taktgruppe andern kann. Es sei im iibrigen 
darauf hingewiesen, dafi die Zugrif f sverwaltung eines XPP- 

30 bzw. Datenverarbeitungslogikzellenfeldes mit Zugrif f als in- 
terner Speicher wie bei einem Vektorregister und als Cache- 
artiger Speicher fur den externen Zugriff was die Speicherzu- 
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griff e angeht bereits beschrieben wurde in der DE 196 54 595 
und der PCT/DE 97/03013 (PACT03) . Die genannten Schriften 
sind durch Bezugnahme zu Of f ehbarungszwecken hiermit vollum- 
fanglich eingegliedert . 

5 

Vorstehend wurde auf Datenverarbeitungslogikzellenfelder Be- 
zug genommen, die insbesondere zur Laufzeit rekonf igurierbar 
sind. Es wurde diskutiert, dass bei diesen eine Konfigurati- 
onsverwaltungseinheit (CT bzw. CM) vorgesehen werden kann. 

10 Aus den diversen, zu Of f enbarungszwecken unter Bezug genoirime- 
nen Schutzrechten des Anmelders sowie seinen weiteren 
Verof f entlichungen ist die Verwaltung von Konf igurationen per 
se bekannt. Es sei nun explizit darauf hingewiesen, dass der- 
artige Einheiten und der en Wirkungsweise, mit der 

15 insbesondere unabhangig von Ankopplungen an Sequenziell-CPUs 
etc. aktuell noch nicht benotigte Konf igurationen vorladbar 
sind, auch sehr gut nutzbar sind, urn im Multitaskingbetrieb 
und/oder bei Hyperthreading und/oder Multithreading einen 
Task- beziehungsweise einen Thread- und/oder Hyperthreadwech- 

20 sel zu bewirken. Dazu kann ausgeniitzt werden, dass wahrend 
der Laufzeit eines Threads oder Tasks in die Konf igurations- 
speicher bei einer einzelnen oder einer Gruppe von Zellen des 
Datenverarbeitungslogikzellenfeldes, also beispielsweise ei- 
ner PAE eines PAE-Feldes (PA) auch Konf igurationen fur 

25 unterschiedliche Aufgaben, das heifit Tasks oder Threads be- 
ziehungsweise Hyperthreads geladen werden konnen. Dies fiihrt 
dann dazu f dass bei einer Blockade eines Tasks oder Threads, 
etwa wenn auf Daten gewartet werden muss, weil diese noch 
nicht verftigbar sind, sei es, da sie von einer anderen Ein- 

30 heit noch nicht generiert oder empfangen wurden, 

beispielsweise auf Grund von Latenzen, sei es, weil eine Res- 
source derzeit noch durch einen anderen Zugriff blockiert 
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ist, dann Konf igurationen fur einen anderen Task oder Thread 
vorladbar und/oder vorgeladen sind und auf diese gewechselt 
werden kann, ohne dass der Zeitoverhead fur einen Konfigura- 
tionswechsel bei der insbesondere schattengeladenen 
5 Konf iguration abgewartet werden muss. Wahrend es prinzipiell 
moglich ist, diese Technik auch dann zu verwenden, wenn in- 
nerhalb eines Tasks die wahrscheinlichste Weiterfuhrung 
vorhergesagt wird und eine Vorhersage nicht zutrifft (predic- 
tion miss), wird diese Art des Betriebs bei vorhersagef reiem 

10 Betrieb bevorzugt sein. Bei Verwendung mit einer rein sequen- 
tiellen CPU und/oder mehreren rein sequentiellen CPUs wird 
somit durch die Zuschaltung eines Konf igurationsmanagers eine 
Hyperthreadingverwaltungshardware realisiert. Verwiesen sei 
hinsichtlich dessen insbesondere auf PACT10 (DE 198 07 872. 2 , 

15 WO 99/44147> WO 99/44120) . Dabei kann es als ausreichend er- 
achtet werden, insbesondere dann, wenn nur fur eine CPU 
und/oder einige wenige Sequenziell-CPUs eine Hyperthreading- 
verwaltung gewiinscht ist, auf bestimmte, in den speziell 
unter Bezug genommenen Schutzrechten beschriebene Teilschal- 

20 tungen wie den FILMO zu verzichten. Insbesondere wird damit 
die Verwendung der dort beschriebenen Konf igurationsmanager 
mit und/oder ohne FILMO fur die Hyperthreadingverwaltung fur 
eine und/oder mehrere rein sequenziell arbeitende CPUs mit 
oder ohne Ankopplung an eine XPP oder ein anderes Datenverar- 

25 beitungslogikzellenfeld offenbart und hiermit fur sich 

beansprucht. Es wird hierin eine fur sich erf inderische- Be- 
sonderheit gesehen. Es sei im Obrigen erwahnt, dass eine 
Vielzahl von CPUs realisiert werden kann mit den bekannten 
Techniken, wie sie insbesondere aus PACT 31 (DE 102 12 621.6- 

30 53, PCT/EP 02/10572) bekannt sind, bei welchen innerhalb ei- 
nes Arrays eine oder mehrere Sequenziell-CPUs aufgebaut 
werden unter Ausnutzurig eines oder mehrerer Speicherbereiche 
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insbesondere im Datenverarbeitungslogikzellenf eld fur den 
Aufbau der sequenziellen CPU, insbesondere als Befehls- 
und/oder Datenregister . Auch sei darauf verwiesen, dass be- 
reits in fruheren Anmeldungen wie PACT02, (DE 196 51 075.9- 
5 53, WO 98/26356), PACT 04 (DE 196 54 846.2-53, WO 98/29952), 
PACT08, (DE 197 04 728.9, WO 98/35299) offenbart wurde, wie 
Sequenzer mit Ring- und/oder Wahlf rei-Zugrif f-Speichern auf- 
gebaut we r den konnen. 

10 Es sei darauf hingewiesen, dass ein Task- beziehungsweise 

Thread- und/oder Hyperthreadwechsel unter Verwendung der be- 
kannten CT-Technologie derart erfolgen kann und bevorzugt 
auch erfolgen wird, dass einem per se bekannten, Software- 
implement ierten Betriebssystem-Scheduler oder dergleichen von 
15 der CT Perf ormance-Scheiben und/oder Zeitscheiben zugeordnet 
werden, wahrend welchen bestimmt wird., von welchen Tasks oder 
Threads nachfolgend welche Teile per se, unterstellt, dass 
Ressourcen frei sind, abzuarbeiten sind. Dazu sei ein Bei- 
spiel wie folgt gegeben: Zunachst soli fur einen ersten Task 
20 eine Adressfolge generiert werden, gemafi welcher • wahrend der 
Ausfiihrung einer LOAD-Konfiguration Daten aus einem Cache- 
Speicher, an dem ein Datenverarbeitungslogikzellenf eld in"- der 
beschriebenen Weise angekoppelt ist, geladen werden sollen. 
Sobald diese Daten vorliegen, kann mit der Abarbeitung einer 
25 zweiten, der eigentlichen Datenverarbeitungskonf iguration, 

begonnen werden. Auch diese kann vorgeladen werden, da sicher 
feststeht, dass diese Konf iguration, sofern keine Interrupts 
oder dergleichen einen vollstandigen Taskwechsel erzwingen, 
auszuftihren ist. In herkommlichen Prozessoren ist nun das 
30 Problem des sogenannten Cache-Miss bekannt, bei dem die Daten 
zwar angefordert werden, aber nicht im Cache fur den Ladezu- 
griff bereit liegen. Tritt ein solcher Fall in einer Kopplung. 
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gemafi der vorliegenden Erfindung auf, kann bevorzugt auf ei- 
nen anderen Thread, Hyperthread und/oder Task gewechselt 
werden, der insbesondere zuvof von dem insbesondere soft- 
wareimplementierten Betriebssystem-Scheduler und/oder einer 
5 anderen hard- und/oder softwareimplementierten, entsprechend 
wirkenden Einheit fur eine nachstmogliche Ausfuhrung bestimmt 
wurde und demgemafi bevorzugt vorab in einen der verfiigbaren 
Konf igurationsspeicher des Datenverarbeitungslogikzellenfel- 
des insbesondere im Hintergrund wahrend der Ausfuhrung einer 

10 anderen Konf iguration, beispielsweise der LOAD-Konf iguration, 
welche das Laden jener Daten, auf die nun gewartet wird, be- 
wirkt hat, geladen wurde.. Das fur die Vorabkonf iguration 
ungestort von der tatsachlichen Verschaltung der insbesondere 
grobgranular ausgebildeten Datenverarbeitungslogikzellen des 

15 Datenverarbeitungslogikzellenfeldes separate Konf igur at ions - 
leitungen von der konf igurierenden Einheit zu den jeweiligen 
Zellen direkt und/oder uber geeignete Bussysteme gefiihrt sein 
konnen wie per se im Stand der Technik bekannt, sei hier noch 
einmal explizit erwahnt, da diese. Ausbildung hier besonders 

20. bevorzugt ist f um ein ungestSrtes Vorabkonf igurieren ohne 

Storung einer anderen, gerade laufenden Konf iguration zu er- 
moglichen. Wenn dann die Konf iguration, auf welche wahrend 
beziehungsweise auf Grund des Task-Thread- und/oder Hyper- 
threadwechsels gewechselt wurde, abgearbeitet wurde, und 

25 zwar, bei bevorzugten nicljt teilbaren,. ununterbrechbaren und 
somit quasi atomaren Konfigurationen bis zum Ende abgeabeitet 
wurde, wird teilweise eine weitere andere Konf iguration wie 
vorbestimmt durch die entsprechenden Scheduler, insbesondere 
den betriebssystemartigen Scheduler festgelegt, abgearbeitet 

30 und/oder jene Konf iguration, zu welcher zuvor die zugehorige 
LOAD-Konf iguration ausgefuhrt wurde. Vor der Ausfuhrung einer 
Verarbeitungskonfiguration, zu welcher zuvor eine LOAD- 
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Konf iguration ausgefuhrt wurde, kann insbesondere abgetestet 
werden, ob mittlerweile die entsprechenden Daten in das Array 
eingestromt sind, also die Latenzzeit, wie -sie typisch auf- 
tritt, verstrichen ist und/oder die Daten tatsachlich 
5 vorliegen. 

Mit anderen Worten werden dann Latenzzeiten, wenn sie auftre- 
ten, weil z. B. Konf igurationen noch nicht einkonf iguriert 
sind, Daten noch nicht geladen und/oder Daten noch nicht weg- 

10 geschrieben wurden, uberbruckt und/oder verdeckt, indem 

Threads, Hyperthreads und/oder . Tasks ausgefuhrt werden, wel- 
che schon vorkonfiguriert sind und.welche mit Daten arbeiten, 
die schon verfiigbar sind beziehungswei.se die an Ressourcen 
weggeschrieben werden konnen, die ftir das Wegsch.reiben be- 

15 reits zur Verfiigung stehen. Auf diese Weise werden 

Latenzzeiten weitgehend uberdeckt und es wird, eine hinrei- 
chende Anzahl von per se auszufuhrenden Threads, Hyperthreads 
und/oder Tasks unterstellt, eine praktisch 100%-ige Ausnut- 
zxing des Datenverarbeitungslogikzellenfeldes erreicht. 

Mit dem beschriebenen System bezuglich Datenstrom-Fahigkeit 
bei gleichzeitiger Ankopplung an eine Sequenziell-CPU und/ 
oder bezuglich. der Ankopplung eines XPP-Array beziehungsweise 
Datenverarbeitungslogikzeilenfeldes und simultan einer Se- 

25 quenziell-CPO an eine geeignete Schedulereinheit wie einen 
Konfigurationsmanager oder dergleichen lassen sich insbeson- 
dere ohne weiteres echtzeitfahige Systeme realisieren. Zur 
.Echtzeitfahigkeit muss gewahrleistet sein, dass auf eintref- 
fende Daten beziehungsweise Interrupts, die insbesondere das 

30 Dateneintreffen signalisieren, innerhalb einer in keinem Fall 
zu tiberschreitenden Maximalzeit reagiert werden kann. Dies 
kann beispielsweise geschehen durch einen Taskwechsel auf ei- 
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nen Interrupt hin und/oder, beispielsweise bei priorisierten 
Interrupts, durch Festlegung, dass ein gegebener Interrupt 
momentan zu ignorieren ist, wobei auch dies innerhalb einer 
bestimmten Zeit festzulegen ist. Ein Taskwechsel bei derarti- 
gen echtzeitf ahigen Systemen wird typisch auf drei Arten 
erfolgen konnen, naitflich entweder dann, wenn ein Task eine 
bestimmte Zeit gelaufen ist (Watch-dog-Prinzip) , bei Nicht- 
zurverftigungstehen einer Ressource, sei es durch deren 
Blockade durch anderen Zugriff oder aufgrund von Latenzen 
beim Zugriff darauf , insbesondere in schreibender und/oder 
lesender Weise, das heifit bei Latenzen von Datenzugrif f en 
und/oder beim Auftreten von Interrupts. 

Mit der vorliegenden Erfindung kann die Echtzeitf ahigkeit ei- 
nes Datenverarbeitungslogikzellenfeldes nunmehr erreicht 
werden, indem eine oder mehrere von drei moglichen Varianten 
implement iert wird. 

Eine erste Variante dazu besteht darin, dass innerhalb einer 
von dem Scheduler beziehungsweise der CT ansprechbaren Res- 
source ein.Wechsei zur Abarbeitung beispielsweise eines 
Interrupts erfolgt. Sofern die Ansprechzeiten auf Interrupts 
oder andere Anf orderungen so grofi sind, dass wahrend dieser 
Zeit eine Konfiguration ohne Unterbrechung noch abgearbeitet 
werden kann f 1st dies unkritisch, zumal wahrend der Abarbei- 
tung der aktuell laufenden Konfiguration auf jener Ressource, 
die fur die Abarbeitung des Interrupts zu wechseln ist, eine 
Konfiguration zur Interruptabarbeitung vorgeladen werden 
kann. Die Auswahl der vorabzuladenden Interrupt-bearbeitenden 
Konfiguration 1st z. B. durch die CT durchzufuhren. Es ist 
moglich, die Laufzeit der Konfiguration auf der fur die In- 
terruptbearbeitung freizugebenden bzw. zu wechselnden 
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Ressource zu begrenzen. Verwiesen wird dazu auf 
PACT29/PCT(PCT/DE03/000942) . 

Bei Systemen, die schneller auf Interrupts reagieren miissen, 
5 kann es bevorzugt sein, eine einzelne Ressource, also bei- 
• spielsweise eine separate XPP-Einheit und/oder Teile eines 
XPP-Feldes fur eine solche Abarbeitung zu reservieren. Wenn 
dann ein schnell abzuarbeitender Interrupt auftritt, ■ kann 
entweder eine fiir besonders kritische Interrupts schon vorab 

10 vorgeladene Konfiguration abgearbeitet werdeh oder es wird 
sofort mit dem Laden einer Interrupt behandelnden Konfigura- 
tion in die reservierte Ressource begonnen. Eine Auswahl der 
jeweils fur den entsprechenden Interrupt erf orderlichen Ron- 
figuration ist durch' entsprechende Triggerung, 

15 Waveabarbeitung usw. moglich. 

Es sei im Obrigen erwahnt, dass es mit den -schon beschriebe- 
nen Methoden ohne weiteres moglich ist, eine instantane 
Reaktion auf eineh Interrupt zu erhalten, indem liber die Ver- 

20 wendung von LOAD/STORE-Konf igurationen eine Code-Reentranz 
erreicht wird. Hierbei wird nach jeder datenbearbeitenden 
Konfiguration oder zu gegebenen Zeiten, beispielsweise alle 
fttnf oder zehn Konfigurationen eine STORE-Konf iguration aus- 
gefuhrt und dann eine LOAD-Konf iguration unter Zugrif f auf 

25 jene Speicherbereiche ausgeftihrt, in die zuvor weggeschrieben 
wurde. Wenn sichergestellt wird, dass die von der STORE- 
Konf igura-tion benutzten Speicherbereiche so lange unberuhrt 
bleiben, bis durch Fortschreiten im Task eirte weitere Konfi- 
guration samtliche relevanten Informationen (Zustande, Daten) 

30 weggeschrieben hat f ist sichergestellt, dass bei Wiederladen, 
also Wiedereintritt in eine zuvor bereits begonnene, aber 
nicht zu Ende gefuhrte Konfiguration oder Konf igurationskette 
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wieder dieselben Bedingungen erhalten werden. Eine solche 
Zwischenschaltung von LOAD/ STORE-Konf igurationen unter simul- 
tanem Schutz von noch nicht veralteten STORE- 
Speicherbereichen lasst sich automatisch ohne zusatzlichen 
5 Programmieraufwand sehr einfach generieren, z. B. von einem 
Compiler. Dort kann die Ressourcenreservierung gegebenenf alls 
vorteilhaft sein. Das bei der Ressourcenreservierung und/oder 
in anderen Fallen auf zumindest eine Menge hochpriorisierter 
Interrupts durch Vorabladen von bestimmten Konf igurationen 
10 reagiert werden kann, sei noch einmal erwahnt. 

Eine weitere, besonders bevorzugte Variante der Reaktion auf 
Interrupts besteht dann, wenn zumindest eine der ansprechba- 
ren Ressourcen eine Sequenziell-CPU ist, darin, auf dieser 
15 eine Interrupt-Routine abzuarbeiten, in welcher wiederum Code 
fur das Datenverarbeitungslogikzellenf eld verboten ist. Mit 
anderen Worten wird eine Interrupt-Routine ausschliefilich auf 
einer Sequenziell-CPU abgearbeitet, ohne dass XPP-Datenverar- 
beitungsschritte aufgerufen werden. Dies garantiert, dass der 
20 Verarbeitungsvorgang auf dem Datenverarbeitungslogikzellen- 
feld nicht zu unterbrechen ist und es kann dann eine 
Weiterabarbeitung auf diesem Datenverarbeitungslogikzellen- 
feld nach einem Taskswitch erfolgen. Obwohl damit die 
eigentliche Interrupt-Routine keinen XPP-Code besitzt, kann 

25 dennoch dafur gesorgt werden, dass auf einen Interrupt hin zu 
einem spateren, nicht mehr echtzeitrelevanten Zeitpunkt mit 
der XPP auf einen durch einen Interrupt und/oder eine Echt- 
zeitanforderung erfassten Zustand und/oder Daten unter 
Verwendung des Datenverarbeitungslogikzellehfeldes reagiert 

30 werden kann. 
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Es ist bei der Erfindung moglich, bei einem an eine CPU ange- 
koppelten Datenverarbeitungslogikzellenf eld optimierte 
Konfigurationen in das Feld zii laden, das insbesondere aus 
einem Analog/Digital-Mischfeld bestehen kann und Zellen mit 
5 frequenzoptimierten Aspektverhaltnis besitzt. Beim Laden von 
Konfigurationen kanri es nun sehr vorteilhaft sein, wenn Busse 
dynamisch aufbaubar sind. Die vorliegende Erfindung offenbart 
daher zugleich ein Verfahren zum dynamischen Aufbau von Bus- 
sen in Feldern miteinander kommunizierender Elemente, 
10 insbesondere rekonf igurierbarer Felder wie Prozessoren grob- 
granularer Felder, das in Verbindung mit den andere Aspekten 
besonders vorteilhaft ist, aber zugleich auch fttr sich genom- 
men erf inderisch- 

15 Es ist bereits bekannt, grobgranulare Felder rekonf igurierba- 
rer Elemente vorzusehen, bei denen zwischen den 
rekonf igurierbaren Elementen Bussysteme verlaufen. In bekann- 
ten Anwendungen werden die Bussysteme, die die Verbindungen 
. fur die Kommunikation der einzelnen Elemente untereinander 

20 vorsehen, durch eine zentrale Einheit konf iguriert . Die Art 
und Weise, wie die Busverbindung aufgebaut werden soil, kann 
dabei im Vorfeld bestimmt werden, etwa zu .einer Compilezeit. 
Denkbar ist auch eine Festlegung zur Laufzeit, bei der durch 
einen Scheduler oder dergleichen fur verschiedene, aktuell zu 

25 ladende Konfigurationen ein Busaufbau vorgenommen wird, . bzw. 
ein Routing. Auf die Anmeldung 102 36 272.8 wird hierzu ins- 
besondere hingewiesen, da diese Anmeldung bereits zeigt, wie 
aus unterschiedlichen Konfigurationen zur Ausfuhrung ein und 
desselben Programmes zu einer Laufzeit eine Auswahl erfolgen 

30 kann. 
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Es sind auch schon Bussysteme fur rekonf igurierbare Prozesso- 
ren bekannt, bei denen ein dynamischer Busaufbau erfolgen 
kann. Erwahnt sei, dafi es insbesondere moglich ist, Bussyste- 
me zu mischen, namlich die bekannten, sogenannt „globalen" 
5 dynamisch aufbaubaren Busse und nicht dynamisch aufbaubare 
Busse. Dies gilt auch fur die nachfolgend offenbarten Bussy- 
steme und -verfahren, das heifit die beschriebenen Bussysteme 
und Verbindungsaufbauverfahren mussen nicht die einzigen, in 
einem Feld zu verbindender Elemente vorzusehenden Bussysteme 
10 bzw. -verfahren sein. 

Es ist auch moglich, und dies gilt auch fur Zwecke der vor- 
liegenden Erfindung, neben grobgranularen Einheiten mit 
insbesondere feingranularer Steuerlogik, wie f eingranularen 

15 Triggernetzwerken usw. eine sogenannte Makrogranularitat vor- 
zusehen, bei der eine Vielzahl grobgranularer Elemente mit 
herkommlichen Bussystemen usw. zusammengef asst werden und bei 
denen dann mehrere solcher zusammengefasster, grobgranularer 
Elemente f . zwischen denen bereits Bussysteme in konf igurierba- 

20 rer oder fester Weise vorgesehen sein konnen f wiederum uber 
Bussysteme kommunizierende Teile einer ubergeordneten Einheit 
bilden. Hierarchische Strukturen fur derartige Anordnungen 
sind beispielsweise aus DE 199 26 538.0 od. PCT WO 00/77652 
bekannt. 

25 

Es ist oftmals wunschenswert^ Busse dynamisch auf zubauen, be- 
sonders dann f wenn ein Prozessor fur Multitasking, 
Multithreading, Hyperthreading usw. verwendet werden soil, 
und/oder insbesondere wenn sehr grofie Felder aus zum Beispiel 
30 65.536 PAEs oder raehr aufgebaut werden sollen. 
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In einem solchen Fall ist es wiinschenswert, fur eine aut'oma- 
tische, selbsttatige, d.h. selbsterstellende dynamische 
Verbindung von Start- und Zielfeldern innerhalb eines solchen 
Feldes sorgen zu konnen. Als Start- imd/oder Zielelemente 
5 konnen auch neben den aus der herkommlichen XPP-Technologie 
bekannten PAEs Element e vorgesehen werden wie IO-Ports, fel- 
dinterne Speicher, Speicher-Ios, FPGAs, sequentielle CPUs, 
Sequencer, FSM (Finit-State-Machines) reine Lesespeicher, 
reine Schreibspeicher, NILdevices, etc. 

10 

Die vorliegende Erfindung schlagt somit in einem weiteren 
Grundgedanken ein Verfahren zum dynamischen Aufbau einer Ver- 
bindung zwischen einem Sender und einem Empfanger uber einen 
einer Vielzahl moglicher Wege, der von Station zu Station 

15 fortschreitet, vor, bei welchem- vorgesehen ist, dass ausge- 
hend von einer den Busaufbau bewirkenden Einheit (Sender und/ 
Oder Empfanger) eine Anfrage an nachstliegende Stationen ge- 
sandt wird, welche fur den Busaufbau bereit stehen, diesen 
Stationen eine Kennziffer, hier gleichbedeutend, Kenngrofie, 

20 zugeordnet wird, ausgehend von wenigstens einer Vielzahl, be- 
vorzugt jeder freien Station, der eine Kennziffer zugeordnet 
wurde, eine Anfrage an nachstliegende Stationen nach der Ver-. 
fttgbarkeit der Stationen fur einen Busaufbau gesandt wird, 
den verfugbareh Stationen eine weitere Kennziffer zugeordnet 

25 wird, und dies fortgesetzt wird, bis das gewiinschte Ende des 
Busses erreicht ist. 

Ein weiterer wesentlicher Aspekt der vorliegenden Erfindung 
nutzt somit die Erkenntnis aus, dass Busse problemfrei da- 
30 durch aufgebaut werden konnen, dass an nachstliegende 

Obertragungsstationen auf dem Weg eines moglichen Busses An- 
fragen. gesandt werden, ob diese Stationen ftir den Busaufbau 
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bereit stehen und dann, ausgehend von bereitstehenden Statio- 
nery in einem weiteren Schritt diese nachstliegenden 
Stationen angesprochen werden,' wobei durch die Kennzif f erzu- 
ordnung eine Ansprechreihenfolge festgehalten wird, urn anhand 
5 derselben eine Ruckverfolgung des Busaufbaus zu ermoglichen. 
Es ist dabei zwar moglich, dass nicht von jeder angesproche- 
nen und als frei erkannten Station beim Busaufbau 
weitergeschritten wird, weil etwa eine Auswertung in der Sta- 
tion eines gewunschten Zielpunktes zeigt, dass der Busaufbau 
10 sich weit in eine falsche Richtung bewegt hat, bevorzugt wird 
aber von jeder freien Station, der eine Kennzif fer zugeordnet 
wurde, versucht, den Bus weiter aufzubauen, indem die Nach- 
barstationen der zuerst angesprochenen Station gleichfalls 
angesprochen werden. 

15 

Hintergrund hierfiir ist, dass es Situationen geben kann, etwa 
bei einem bereits nahezu vollen Array, in welches weitere 
Konf igurationen hineingesetzt werden sollen, wo es erforder- 
lich ist, einen Busaufbau iiber grSfiere Umwege zuzulassen, urn, 
20 sollte ein Busaufbau uberhaupt moglich sein, diesen sicher zu 
ermoglichen. 

In einer bevorzugten Variante wird regelmaiiig. jeder Station, 
die angesprochen wurde, eihe Kennzif fer zugewiesen. Dies ist 

25 vorteilhaft, urn f estzustellen, dass die Station bereits ange- 
sprochen wurde und somit nicht mehr bei Ansprechen aus einer 
anderen Richtung vermeintlich zur Verfugung steht. Dies ver- 
hindert, dass eine Signalausbreitung noch stattfindet, 
nachdem die Nachbarstationen bereits wieder als nicht benS- 

30 tigt freigegeben wurden. 
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In einer besonders bevorzugten Variante wird die Kenngrofie 
von Station zu Station so verandert, dass der Weg, der beim 
Busaufbau gewahlt wird r nachvollziehbar ist, insbesondere im 
Wege eines Backtracking. Dieses Backtracing kann durch Inkre- 
5 mentierung oder Dekrementierung eines am Ziel erreichten 

Wertes erfolgen, insbesondere mit jeweils fester Schrittwei- 
te. Bei Vorsehen einer festen Schrittweite kann insbesondere 
auch ein zyklisches Zahlen erfolgen, d. h. ein Zahlen in ei- 
nem zyklischen Zahlenraum, bei dem nach Oberschreiten des 

10 hochst moglichen Wertes iinitier wieder mit einem kleineren Wert 
begonnen wird (z. B. 1, 2, 3, 4; 1, 2, 3, 4; 1, 2, 3, 4; 

Oder 1, 2, 3, 4, 5; 1, 2, 3, 4, 5; 1, 2, 3, 4, 5; 

) . Dabei ist dann zur Charakterisierung der Station, urn 

ein einwandf reies Ruckverfolgen des Weges zu gewahrleisten, 

15 ein zyklisches Durchzahlen von mindestens drei verschiedenen 
Zahlwerten bevorzugt. 

Das beschriebene Verfahren wird, sofern tiberhaupt ein Busauf- 
bau zwischen Sender und Empfanger moglich ist, diesen 

i 

20 auf zubauenden Bus . identifizieren. Beim Busaufbau werden aber 

i 

womoglich eine Vielzahl nicht benotigter. Stationen angespro- 
chen und es ist daher bevorzugt, diese wieder freizugeben, 
und zwar nach Aufbau des Busses bzw. mit der Signalisierung 
zwischen Sender und Empfanger, dass ein Busweg aufgebaut wur- 

25. de. Dazu kann ausgehend von der letzten, den Aufbau 

vollendenden Station, typisch als dem Signalempfanger, wenn 
der Busaufbau ausgehend vom Sender hin zum Empfanger erfolgt, 
riickwarts unter Abschreitung der Kennwerte die. davorliegende 
Station angesprochen werden und sichergestellt werden, dass 

30 die von dieser Station angesprochenen, anderen und somit 
nicht auf dem Bus ( ruck) weg liegenden Stationen fur eine 
Fremdnutzung freigegeben wegcden. Dabei wird von jeder ange- 
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sprochenen und fur die weitere Benutzung in anderen Buswegen 
freigegebenen Stationen wiederum f ortgeschritten zu alien an- 
deren, nicht benotigten Stationen, die zuvor angesprochen 
wurden. Auf diese Weise ist sichergestellt, dass alle Statio- 
5 nen, die zuvor fur den Busaufbau angesprochen wurden, nunmehr 
wieder zur Verfugung stehen. 

Es sei erwahnt, dass neben diesem Verfahren zur ruckschrei- 
tenden Freigabe eines aufgebauten Busweges andere 

10 Moglichkeiten existieren, nach Aufbau eines Busweges zwischen 
Sender und Empf anger nicht benotigte Stationen freizugeben. 
So kann etwa langs aller Stationen, die fur den Busweg beno- 
tigt werden, ein Signal gesandt werden, welches den 
' Busstationen mitteilt, dass sie am Busweg beteiligt sind.Ei- 

15 ne solche Information kann wiederum rtickwarts gesandt werden 
im Wege des Back-tracing, etwa indent die Kennziffern ausge- 
wertet werden, die den Stationen wahrend der Aufbauphase 
zugeordnet wurden. Danach kann eine globale Freigabe erfol- 
gen, etwa indem ausgehend von der Anfangs station oder einer 

20 zentralen Kontrollinstanz samtliche, momentan nicht an beste- 
henden Bussen verwendeten Stationen zuriickgesetzt bzw. fur 
den Aufbau eines Busweges freigegeben werden. 

Es sei darauf hingewiesen, dass etwa auch unter bestimmten 
25 Bedingungen, wie nach einem festen Zeitablauf , eine Busfrei- 
gabe erfolgen kann. Diese Art der Freigabe. kann allerdings 
verhindern, dass Busse, die per se aufbaubar waren, aufgebaut 
werden konnen; so ist bei sehr grofien Prozessorf elderh denk- 
bar, dass die Wege extrem lang werden, weil tim verschiedene, 
30 im Laufe des Betriebes dynamisch in das Feld hineinkonf igu- 
rierte Zellgruppenanordnungen maanderf ormig ein Weg herum 
bzw. durch solche Konf igurationeh gelegt werden muss, was bei 
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groJien Feldern sehr lange dauern kann. Sorge ist daher bevor- 
zugt daftir zu tragen, dass eine hinreichende Zeit fiir den 
Aufbau eines Busses verbleibt'. 

5 Es sei erwahnt, dass es prinzipiell moglich ist, insbesondere 
in sehr grofien Feldern, simultan mehrere Buswege bzw. Busver- 
bindungen zwischen unterschiedlichen Stationen und 
unterschiedlichen Empfangern aufzubauen. Dies kann jedoch da- 
zu fiihren, dass sich zwei aufzubauende Busverbindungen 

10 wechselseitig im Fortschreiten blockieren, so dass keiner von 
den beiden Bussen erfolgreich eine Verbindung aufbaut. Es 
kann mit anderen Worten zu einem Deadlock kommen.. Dass derar- 
tige Deadlock-Situationen auch bei simultanem Aufbau mehrerer 
Busse verhindert werden konnen, sei. erwahnt. So ist yorstell- 

15 bar, Bussen. eine Prioritat zuzuordnen und damit zu 

gewahrleisten, dass dann, werin ein auf zubauender Bus hoher 
Prioritat auf einen gleichf alls noch nicht "auf gebauten Bus 
geringerer Prioritat trifft, die Stationen des Busses mit ge- 
ringerer Prioritat beset zt werden, d. h. dass die vorherige 

20 Reservierung fiir einen auf zubauenden. Bus geringerer Prioritat 
ignoriert wird. Dabei wird die tatsachliche Implementierung 
derartiger Verbindungs aufbaut en abhangig davon zu gestalten 
sein, wie die fur die Busaufbauprotokollumsetzung erforderli- 
che Logik in eine Halbleiterarchitektur umzusetzen ist, d. h. 

25 welcher Aufbau im Einzelfall erforderlich ist; wie der Bu- 
saufbau und erf orderlichenfalls der Versuch eines Neuaufbaus 
nach Scheitern eines ersten Versuchs auszusehen hat, ob eine. 
Priorisierung erfolgen soil und kann, wobei vorstellbar ist, 
eine Priorisierung eines auf zubauenden Busses etwa nach Be- 

30 deutung des Makros, das in das Feld konfiguriert wird, der 
Wartezeit seit dem Versuch eines ersten Aufbaus usw. , zu be- 
st immen. 
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Prinzipiell ware es moglich, nach dem Erreichen des Ziels 
ausgehend vom Start, also typi'sch nach Erreichen des Empf an- 
gers ausgehend vom den Busaufbau typisch bewirkenden Sender, 
5 lediglich ein Signal auszusenden, das dem Sender anzeigt, 
dass ttberhaupt ein Bus aufbaubar ist, damit dieser mit dem 
Senden beginnen mag. In einem solchen Fall konnte ein abzu- 
sendendes Datenpaket einfach wie eine Stationsaufbauanf rage 
an alle Nachbarstationen gesandt werden. Es musste dann aber 

10 mit jedem Datenpaket sichergestellt werden, dass am Empf anger 
erkannt werden kann, von wo, das heifit von welcher Station 
ein abgesandtes Datenpaket zuerst empfangen wird, es muss si- 
chergestellt werden, dass ein bestimmtes Datenpaket nur 
einmal empfangen wird, auch wenn es liber andere, verschlunge- 

15 ne Pfade spater noch einmal zum Empf anger gelangt. Bevorzugt 
wird aber in jedem Fall sein, dass die anderen Stationen 
freigegeben werden, etwa durch Back-tracing nach Erreichen 
der Zielstation. Dieses Busbeteiligungssignal, das ruckwarts 
gesandt wird, kann ausgehend von den Zahlenwerten, die den 

20 Nachbarstationen zugeordnet werden, erfolgen. Im tibrigen sei 
darauf hingewiesen, dass es gleichfalls moglich ist, dass 
sich die Station lediglich merkt, aus welcher Richtung aus 
sie angesprochen wurde. In einem solchen Fall kann ohne Ver- 
gleich an den Nachbarstationen, welche Kennzif f erwerte diese 

25 besitzen, elne Rtickverfolgung sehr schnell geschehen und es 
kann tiberdies dann, wenn in der Station festgehalten wird, 
welche Nachbarstationen beim Busaufbau noch angesprochen wur- 
den, gewahrleistet werden, dass auch beim Back-tracing die 
nicht am aufgebauten Bus beteiligten Stationen freigegeben 

30 werden. 
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Die einer Station beim Ansprechen zuzuordnende Kennziffer 
kann daher auch eine Kennziffer sein, die die Richtung an- 
gibt, von welcher aus die Station angesprochen wurde. Bei 
vier nachsten anzusprechenden Nachbarn reichen dafur bei- 
5 spielsweise zwei Bit. Werden zusatzlich noch die Stationen 
gespeichert, die angesprochen worden sind, wahrend der Bus 
aufgebaut wurde , sind weitere vier Bit erforderlich bei einer 
Vier-nMchste-Nachbarn-Architektur. Es kann ein weiteres Bit 
hinzugefugt werden, urn zu kennzeichnen, ob die Station ttber- 

10 haupt schon angesprochen wurde oder vom Busaufbau des aktuell 
aufzubauenden Busses bislang unberiihrt geblieben war. Kommen 
Priorisierungen und dergleichen dazu, sind weitere Zustande 
festzuhalten. Es sei darauf hingewiesen, dass dies feingranu- 
lar erfolgen kann, und zwar insbesondere auch dann, wenn das 

15 Prozessorfeld fur sich grobgranular aufgebaut ist. 

Es sei weiter darauf hingewiesen, dass verschiedene Moglich- 
keiten existieren, nach dem erf olgreichen Aufbau eines ersten 
Busses zwischen einem ersten Sender und einem ersten Empfan- 

20 ger den Aufbau eines zweiten Busses, zwischen z. B. einem 
zweiten Sender und einem zweiten Empf anger zu ermSglichen; 
dabei kann auch einer der Sender und/oder einer der Empfanger 
identisch sein. Das Ansprechen von zwei Empfangern aus ein 
und demselben Sender kann sinnvoll sein, wenn etwa ein Be- 

25 rechnungsergebnis als Eingang ftir zwei verschiedene Zweige 

eines Programmes, die in unterschiedliche- Bereiche hineinkon- 
figuriert sind, bendtigt wird. Ein Ansprechen eines einzelnen 
Empfangers aus mehreren Sendern kann erwtinscht sein, wenn 
dort etwa zwei Operanden, die aus unterschiedlichen Konfigu- 

30 rationsbereichen erhalten werden sollen, zu verknupfen sind, 
und ein Ansprechen von einem Empfanger uber ein und denselben 
Sender kann geboten sein, wenn Operanden, die zu unterschied- 
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lichen Zeiten erhalten bzw. bestimmt wurden, an ein und dem- 
selben Empfanger miteinander verkniipft werden sollen, etwa in 
der Form a n x a n -i. Es kann danri iiber Register im Bus sicherge- 
stellt werden, dass eine solche Verknupfung nach Aufbau von 
5 zwei Bussystemen moglich ware, auch wenn dies typisch schon 
aus Grunden des Energieverbrauches im Bussystem weniger be- 
vorzugt ware als eine lokale Zwischenspeicherung von 
Operanden und dergleichen. Der Aufbau des weiteren oder 
nachst auf zubauenden Busses kann etwa dadurch erfolgen, dass 

10 mit dem Stationsf reigabesignal nach vorlaufiger Reservierung 
einer Station ein Signal mitgesandt wird, welches angibt, 
welchem aufgebauten .Bus die Station gehorte, wobei dieser Bus 
etwa wiederum durch ein Priorisierungssignal gekennzeichnet 
werden kann. Wenn eine freigebende Station dann einer Station 

15 benachbart liegt, die gerne selbst einen Bus aufbauen wurde, 
der eine geringfiigig niederere Priorisierung hat, kann dies 
dort festgestellt werden und es kann dann von dieser Station 
ausgehend der nachste Busaufbau bewirkt werden. Alternativ 
kann, bei einer globalen Freigabe aller momentan nicht an ei- 

20 nem Busaufbau benotigten Stationen und/oder danach ein 

globales Signal abgesandt werden, etwa von einer zentralen 
Kontrollinstanz, welches dem Feld mitteilt, welche Busverbin- 
dung als nachste aufzubauen ist bzw, welche Prioritat die 
nachste aufzubauende Busverbindung haben soil. Statt eines 

25 globalen Broadcast einer derartigen Busaufbauverwaltungs in- 
formation kann auch insbesondere zentral und/oder an mehreren 
Stellen dezentral, etwa bei hierarchisch angeordneten Prozes- 
sorfeldern, bei denen innerhalb eines bestimmten Bereiches 
ein Bus- aufbau gewiinscht wird, lokal und/oder regional eine 

30 Signalisierung an eine einen Busaufbau anfordernde Station 

wie einen Sender, der seinen Empfanger erreichen muss, erfol- 
gen. 
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Welche Art cier Stationsf reigabe und/oder der Mitteilung, dass 
ein weiterer Bus aufgebaut werden kann, tatsachlich implemen- 
tiert wird, wird insbesondere davon abhangig sein, wie 
5 schnell die diesbeziigliche Information ttber das Array propa- 
giert werden kann urid/oder welche Busaufbauhauf igkeit liber 
der Zeit erwartet wird. So kann dann, wenn eine Analyse 
zeigt, dass die auf einem Feld typisch benotigten und simul- 
tan abzuarbeitenden Konf igurationen selten einen Busaufbau 

10 erf ordern, ' der zudem langsam erfolgen kann, eine prozessorar- 
chitektonisch einfache Implement ie rung gewahlt werden, die 
mit wenigen Logikelementen auskommt, urn die entsprechende 
Steuerung zu gewahrleisten, wahrend bei sehr haufigem und 
auch schnell benotigtem Busaufbau eine komplexere Implemen- 

15 tierung sinnvoll sein kann. 

In einer besonders bevorzugten Variante ist es moglich, unter 
mehreren per se beziiglich der BuslSnge und/oder des Umfangs 
der Stationen entlang des Busses gleichwertiger Bussysteme 

20 einen Bus auszuwahlen anhand verschiedener objektiver Beur- 
teilungskriterien. Wahrend es prinzipiell moglich ist, in 
einem solchen Fall eine zufallige Wahl zu treffen, kQnnen, je 
nach Anforderung und tatsachlicher Auslegung, unterschiedli- 
che Kriterien herangezogen werden. Es kann etwa bei 

25 Architekturen, die unter schiedliche Busverbindungen in Hori- 
zontal- und Vertikalrichtung aufweisen, etwa wenn die 
Busverbindungen in Vertikalrichtung zusatzlich Register um- 
fassen, durch welche .die Daten zu schleusen sind, wahrend 
langs der Vertikalrichtung registerfrei und somit Daten mit 

30 geringeren Energieverlusten weiterleitende Busverbindungen 
existieren (ein Beispiel fur eine solche Architektur ist die 
XPP 128 des Anmelders) , vorgesehen sein, dass beim Busaufbau 
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vermerkt wird, wie viele Schritte horizontal und vertikal ge- 
gangen wurden. Diese Information kann in einer Station 
abgelegt werden oder an einem 'Header, der mit dem Busauf- 
bauanforderungssignal mitiibertragen wird; es erfolgt dann zur 
5 Busauswahl eine Auswertung derartiger Inf ormationen. Alterna- 
tiv kann etwa an jeder Station abgefragt werden, wie viele 
Busse in der Nahe der Station bereits existieren, urn etwa zu 
ermoglichen, dass eine naherungsweise gleichmafiige Busverbin- 
dungsdichte liber das Array hinweg erhalten wird. Dieses 

10 Vorgehen ist einerseits vorteilhaft, weil der Datentransport 
langs der Busse auf Grund der erforderlichen Umladung der 
Busleitungskapazitaten, den in Bussen zu integrierenden Trei- 
bern usw. einen erhohten Energieverbrauch ergibt,. weshalb 
eine Vergleichmafiigung der Busverteilungsdichte liber das Pro- 

15 zessorfeld zu einer Vergleichmafiigung der thermischen 

Belastung fiihrt. Insofern kann durch die Vergleichmafiigung 
insgesamt womoglich die Taktrate bei gleicher Kuhlung erhoht 
werden r was im Bereich mobiler Prozessoren fur Laptops, Han- 
dys und dergleichen vorteilhaft ist. Andererseits ist ^ine 

20 . BusverbindungsdichtevergleichmaJiigung auch vorteilhaft fur 
die Auslastungserhohung und Ressourcenschonung. 

Schutz wird auch beansprucht fur ein multidimensionales Feld 
rekonfigurierbarer Elemente, in welchem Bussysteme ftir den 

25 dynamischen Selbstaufbau in einer der vorbeschriebenen Weisen 
und/oder in einer Weise, wie sie aus djem nachfolgenden er- 
sichtlich ist f vorgesehen sind. Es sei darauf hingewiesen, 
dass die Bezeichnung „multidimensionales Feld rekonfigurier- 
barer Elemente" sich auf grobgranulare rekonf igurierbare 

30 Elemente mit Elementen wie ALOs, erweiterten ALUs f RAMPAEs 
usw. beziehen kann, wie sie vorerwahnt wurden, und dass im 
Sinne der Erfindung eine Multidimensionalitat nicht nur durch 
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die raumliche (Jbereinanderanordnung und Nebeneinanderanord- 
nung von rekonfigurierbaren Elementen erhalten werden kann, 
sondern auch durch eine bestimmte Art und Weise der Verbin- 
dung. So sind in linear angeordneten Feldern den Elementen in 
5 der Mitte zwei nachste Nachbarn zugeordnet, in zweidimensio- 
nalen Feldern wie bei einer Kachelung typisch vier nachste 
Nachbarn, und in einer dreidimensionalen Anordnung typisch 
sechs nachste Nachbarn, wie dies aus der Stapelung von Wur- 
feln urid dergleichen erkannt werden kann. Die Verwendbarkeit 

10 etwa drei- oder sechseckiger Zellen sei beispielhaft erwahnt. 
Es ist aber auch moglich, zusatzlich Busverbindungen vorzuse- 
hen, die diagonal verlaufen, iibernachste Nachbarn verbinden, 
grofiere Strecken vorsehen usw. Wird eine solche Busstruktur 
implement iert, ergibt sich eine Multidimensionalitat mit ei- 

15. nem Dimensionsmafi groBer 1, wobei dieses Dimensionsmafi auch 
von einer ganzen Zahl verschieden sein kann. Eine solche An- 
ordnung wird in jedem Fall als multidimensionales Feld der 
vorliegenden Erfindung betrachtet. 

20 Die vorliegende Erfindung wird im Folgenden nur beispielswei- 
se an Hand der Zeichnung beschrieben. In dieser zeigt: 



Fig. 



El ein multidimensionales Feld miteinander kommuni- 



25 



zierender rekonf igurierbarer Elemente, die fur 
den Busaufbau ausgebildet sind, vor dem Beginn 
des Busaufbaus; ' 



Fig. 



E2 das Feld von Fig. 1 nach dem ersten Busaufbau- 
schritt; 



Fig. 



E3 das Feld von Fig. 1 nach dem zweiten Busaufbau- 



30 



schritt; 
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Fig. E4 das Feld von Fig. 1, nachdem das Empfangerf eld 

erreicht wurde, mit unterschiedlichen, moglichen 
Busverbindungen; 

Fig. E5 die Anordnung mit dem ausgewahlten Bus. 

5 

Nach Fig. 1. umfasst ein allgmein mit 1 bezeichnetes Feld 1 
eine Vielzahl rekonf igurierbarer Zellen, die miteinander uber 
selbstaufbauende Busse kommunizieren konnen. 

10 Jede Zelle la, lb, lc usw., die am Busaufbau zu beteiligen 

ist, weist interne Logikelemente auf f die es ermoglichen, In- 
formationen daruber zu speichern, ob die Zelle derzeit von 
einem Bus bereits verwendet wird (mit X gekennzeichnete Zel- 
len in Feld 1) , ob die Zelle bereits als mogliche Buszelle 

15 bei einem aktuellen Busaufbau angesprochen wurde , und, wenn 
ja, in wie vielen vertikalen und horizontalen Schritten der 
Busaufbau bis zur Zelle erfolgte, wie viele Schritte insge- 
samt beim Busaufbau zuruckgelegt wurden oder ob die Zelle 
noch vollstandig frei ist und noch nicht angesprochen wurde. 

20 Urn die Anzahl der horizontal bzw. vertikal von einem Bus be- 
reits abgeschrittenen Zellen auf dem Weg zwischen einer 
moglichen Senderzelle S und einer moglichen Empfangerzelie e 
abzulegen, sind in jeder Zelle zwei Speicherbereiche vorgese- 
hen f die in den Figuren mit H und V bezeichnet sind. Weiter 

25 ist ein Speicherbereich fur die Gesamtzahl der durchlauf enen 
Schritte ablegbar, wie durch die grossen Zahlen 1 - 12 in den 
Figuren 1 - 5 dargestellt. Dabei ist die gewahlte Maximalzahl 
12 nur beispielhaft, da dies im gewahlten Beispiel geringer 
Komplexitat die erforderliche Schrittzahl zum Erreichen des 

30 Empf angers, ausgehend vom gewahlten Sender, ist. Die Zellen 
sind weiter dazu ausgebildet, dann, wenn sie ein Busaufbauan- 
forderungs signal erhalten und frei.. sind, an einem 
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auf zubauenden Bus teilzunehmen, und zugleich an Nachbarsta- 
tionen in einem nachfolgenden Schritt eine Anfrage zu senden, 
ob diese Nachbarstationen gleichfalls fur den Busaufbau frei 
sind. Dazu weisen sie Signal-Sende- und -Empf angsverbindungs- 
5 beschaltungen fur die jeweils nachsten Nachbarn auf. Die 
einzelne Zelle ist weiter so ausgebildet, dass zusammen mit 
dem Busaufbauanf orderungssignal Information bezuglich der 
insgesamt schon zurtickgelegten Schrittweite und der Anzahl 
der horizontalen und vertikalen Teilschritte (H und V) an die 
10 angesprochenen Stationen tibermittelt werden kann. 

Der Busaufbau geschieht im vorliegenden Fall wie folgt: 
Zunachst wird das dynamisch konf igurierbare Array derart be- 
trieben, dass alle Busse aufgebaut seien. Es mogen dann 

15. bestimmte Konf igurationen enden und es sei erforderlich, eine 
neue Konfiguration f ragmentiert in freie Bereiche des Arrays 
hineinzukonfigurieren, weil eine hinreichende Anzahl funktio- 
nell geeigneter Zellen derzeit nicht zur Verfugung steht. Es 
sei dabei weiter ein Fall gegeben, bei welchem alle Felder 

20 bis auf die mit X bezeichneten fur den Busaufbau zur Verfu- 
gung stehen. 

Nun wird von jenen Zellen, die miteinander zu. kommunizieren 
haben, um ein in das Array hineinzukonfigurierendes Makro 

25 ausftihren zu konnen, eine Sende- und eine Empf angs zelle fest- 
gelegt. Dies kann durch die Konfiguration bzw. den Scheduler 
oder ahnliches geschehen. Diese sind in Fig. 1 mit S bezeich- 
net. Nun sendet die den Busaufbau bewirkende Sender zelle S 
ein erstes Busaufbauanforderungssignal an ihre unmittelbaren 

30 Nachbarn, das heisst jene Zellen, die an deren Zellenkanten 
angrenzen, im dargestellten Beispiel also an vier Zellen. 
Diese Zellen stellen fest, dass sie frei sind, dass sie die 
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ersten Stationen sind, die Busaufbauanf orderungssignale er- 
halten, und dass sie jeweils einen Schritt horizontal oder 
vertikal respektive von der Sendezelle entfernt sind. Es wird 
nun in den Nachbarzellen entsprechend in den H- und V- 
5 Speicherbereich eine 0 bzw. 1 eingespeichert, und es wird ei- 
ne 1 in den Schrittweitenspeicher der angefragten Zelle 
gespeichert. 

Im zweiten Schritt spricht jede zuvor angesprochene freie 
10 Zelle wiederum ihre eigenen Nachbarzellen an und fragt bei 
diesen an, ob sie fur den Busaufbau zur Verfugung stehen. 
Dies fuhrt dazu, dass eine Reihe weiterer Zellen danach er- 
kannt haben, dass sie fur den Busaufbau benotigt werden und 
die zweiten Zellen im Verlauf eines moglicherweise aufgebau- 
15 ten Busses darstellen. Weiter werden entsprechende Vermerke 
uber die horizontale bzw. vertikale Schrittweite in entspre- 
chenden Speicherbereichen abgelegt. Die bereits mit X 
gekennzeichneten Zellen ignorieren hingegen das Busaufbauan- 
forderungssignal, wie das in der 4. Zelle von links, 2. Zeile 
20 von unten der Fall ist. 

Nachdem die ersten Zellen ihre Nachbarzellen. angesprochen ha- 
ben, ist klar, dass sie in weiteren Busaufbauschritten 
schweigen kennen; ein Busanforderungssigrial wird so nur un- 

25 mittelbar im Schritt nach jenem ausgesandt, welcher die das 
Busaufbauanf orderungssignal aussendende Zelle reserviert hat. 
Dies verhindert zwar, dass Zellen, die erst wahrend des Bus- 
aufbaus f reigegeben. warden, spater noch reservierbar sind, 
spart aber, da nicht immer wleder von alien bereits reser- 

30 vierten Zellen Busaufbauanf orderungssignale ausgesandt werden 
miissen, was Treiberleistung erfordert, Energie und ist somit 
etwa fur mobile Anwendungen bevorzugt, wo der erhalt'ene Vor- 
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teil uberwiegt gegeniiber Losungen, bei denen spater freiwer- 
dende Zellen auch noch in einen entstehenden Bus 
miteinbezogen werden konnen; hier ware allerdings besonders 
etwa Sorge dafiir zu tragen, dass stets in jenen Nachbarzellen 
5 der Bus-aufbau als relevant eingestuft wird, die die gering- 
sten Schrittweiten langs des Busses erfordern. im nachsten 
Busaufbauschritt sprechen nun die zweiten Zellen ihre jewei- 
ligen Nachbarzellen wiederum an, wobei, da die Zellen 1 fur 
den Busaufbau schon reserviert sind, die Zellen 2 nicht mehr 
10 zuriicklaufen konnen, sondern nur nach vorne, weg vom Sender. 
Dies setzt sich fort, bis der Empfanger schlieBlich erreicht 
ist, vergleiche Fig. 4. 

Es sind nun im Beispiel am Empfanger zwei Zellen gleichzeitig 
15 angekommen, die beide die gleiche Schrittweite 12 tragen und 
es ist, wie durch die verschieden gestrichelten Linien er- 
sichtlich, moglich, iiber diese Zellen ruckwartsschreitend 
unterschiedliche Buswege aufzubauen. Es ware hier. zwar prin- 
zipiell eine zufallige Auswahl moglich, es wird aber, wie 
20 bevorzugt, zunachst bei jedem Abschreiten in Ruckwartsrich- 
tung versucht, die V-Werte maximal zu halten. Dies fiihrt zu 
dem durchgehend gezeichneten Bus in Fig. 5. Sobald der Bu- 
saufbau durch Rtickwartsschreiten bestatigt wurde, konnen alle 
Zellen, die nicht daran beteiligt sind, abgewiesen-und wieder 
25 freigegeben werden. Dazu wird ein globales Busf reigabesignal 
ausgestrahlt, das anzeigt, dass alle derzeit nicht an einem 
aufgebauten Bus beteiligten Zellen sich zurttcksetzen kSnnen. 

Es sei erwahnt, dass die Art und Weise des Busaufbaus durch 
30 dynamische Selbstorganisation unter Verwendung geeigneter, 
dem Durchschnittsfachmann aus der Offenbarung ersichtlichen 
Hardwareschaltungen in der Zelle festlegbar ist. 
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Paten tan sprizche 

1. Verfahren zur Auswahl eines aus einer Vielzahl von Wegen 
5 zur Erzielung eines Datenverarbeitungsergebnisses bei der 

Datenverarbeitung unter zumindest moglicher Verwendung 
multidimensionaler Felder konf igurierbarer Datenhandha- 
bungselemente, dadurch gekennzeichnet, dafi den 
Datenhandhabungselementen konf igurationsabhangig lei- 
10 stungsaufnahmebezogene kennzeichnende Grofien zugeordnet 
werden und eine Wegauswahl unter Zuordnungsbewertung er- 
folgt. 

2. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
15 kennzeichnet, dafi einer aus einer Vielzahl 

unterschiedlicher Algorithmen ausgewahlt wird. 

3. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , dadurch gekennzeichnet r 

20 dafi eine aus einer Vielzahl unterschiedlicher Konfigura- 
tionen ausgewahlt wird. 

4. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , dadurch ge kennzeichnet, 

25 dafi tiber die Zuordnung einer gegebenen Datenverarbeitungs- 
aufgabe und/oder -teilaufgabe an ein multidimensionales 
Feld konfigurierbarer Datenhandhabungselemente und/oder 
einer anderen Datenverarbeitungsarchitektur f insbesondere 
an ein ASIC, und/oder an eine rein sequenziell arbeitende 

30 CPU bei der Wegauswahl entschieden wird. 
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5. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , dadurch gekennzeichnet, 
dafi ein zweidimensionales Feld konf igurierbarer Datenhand- 
habungselemente betrachtet wird. 

5 

6. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , dadurch gekennzeichnet, 
dafi eine Auswahl aus einem zur Laufzeit konf igurierbaren, 
insbesondere storungsfrei partiell rekonf igurierbaren Pro- 

10 zessorfeld vorgenommen wird. 

7. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , dadurch gekennzeichnet, 
daft als konf igurierbare Datenhandhabungselemente zumindest 

15 einige, bevorzugt alle der Elemente Busse f Register, ALUs, 
RAMs und/oder andere grobgranulare Datenhandhabungselemen- 
te betrachtet werden. 

8. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
20 oder einem Unteranspruch hierzu , dadurch gekennzeichnet, 

dali der kennzeichnende Wert unabhangig von der tatsachli- 
chen aktuell zugeordneten Aufgabe nur davon abhangig 
gewahlt wird, ob das jeweilige Datenhandhabungselement 
uberhaupt verwendet wird oder nicht. 

25 

9. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dali jeder Konf igurat ion eine eigene Kennzahl 
bei der Verwendung zugeordnet wird. 

30 10. Verfahren nach dem vorhergehenden unabhangigen An- 
spruch oder einem Unteranspruch hierzu , dadurch 
gekennzeichnet, dafi eine strom-, arbeits- und/oder lei- 
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stungsbezogene Grofie als verbrauchskennzeichnende Grolie 
zugeordnet wird. 

11. Verfahren nach dem vorhergehenden Anspruch, dadurch 
5 gekennzeichnet , dali eine Auswahl unter Beriicksichtigung 

eines Summenwertes verbrauchskennzeichnender Grolien er- 
folgt. 

12. Verfahren nach dem vorhergehenden unabhangigen An- 
10 spruch oder einem Unteranspruch hierzu , dadurch 

gekennzeichnet, dali eine Auswahl unter Beriicksichtigung 
weiterer Grolien erfolgt, insbesondere einer erf order lichen 
Ausfuhrungszeit und/oder erf orderlicher Ressourcen, einer 
aktuellen Prozessorauslastung und/oder einer aktuell ge- 
15 wunschten und/oder moglichen Leistungsaufnahme. 

13. Verfahren nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet, dali eine Auswahl vor der eigentlichen Da- 
tenverarbeitung erfolgt. 

20 

14. Verfahren nach dem vorhergehenden unabhangigen An- 
spruch oder einem Unteranspruch hierzu , dadurch 
gekennzeichnet, dali die KennzeichnungsgrSlien bei der Simu- 
lation einer Datenverarbeitung bereitgestellt und/oder 

25 ausgewShlt werden. 

15. Verfahren nach dem vorhergehenden unabhangigen An- 
spruch oder einem Unteranspruch hierzu , dadurch 
gekennzeichnet, dafi eine Auswahl zur Laufzeit erfolgt. 

30 

16. Verfahren zum Betrieb eines multidimensionalen Feldes 
rekonf igurierbarer Elemente, 
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worin Anordnungen von 

Gruppen zusammen datenhandhabender Elemente in vorbestimm- 
ter Weise wahrend der Laufzeit zur Abarbeitung 
vorgegebener Aufgaben in das Feld hinein konfiguriert wer- 
5 den, 

dadurch gekennzeichnet, dafi 

fur zumindest eine abzuarbeitende Aufgabe eine Mehrzahl 
von solchen Elementgruppenanordnungen im multidimensiona- 
len Feld bestimmt wird, die zur Abarbeitung der 
10 vorgegebenen Aufgabe geeignet sind, 

fur die Abarbeitung der vorgegebenen Aufgabe eine dann be- 
sonders geeignete Elementgruppenanordnung aus der Mehrzahl 
ausgewahlt wird und 

die ausgewahlte in das Feld hinein konfiguriert wird. 

15 

17. Verfahren nach dem vorhergehenden Anspruch dadurch ge- 
kennzeichnet, dafi die Elementgruppenanordnung anhand ihrer 
Geometrie im Vergleich mit der Geometrie im Feld bereits 
fur die Umkonf iguration verftigbarer und/oder vermutlich 

20 bald verfugbar werdender Elemente ausgewahlt wird. 

18. Verfahren nach dem vorhergehenden unabhSngigen Anspruch 
oder einem Unteranspruch hierzu , worin Elementgruppenan- 
ordnungen betreffende Konfigurationsdaten aus einem 

25 Speicher mit nicht vernachiassigbaren Zugrif f szeiten ein- 
gelesen werden und/oder mit nicht vernachiassigbaren 
Generierungszeiten generiert werden, dadurch gekennzeich- 
net,, dafi zumindest fttr einige Konf igurationen far die 
Auswahl zunSchst nur ein gegenuber dem Konf igurationsda- 

30 tensatz aller Konfigurationsdaten in der Grofie reduzierter 
Kenndatensatz, insbesondere ein Satz von die Geometrie be- 
treffenden Kenndaten, in eine 
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Elementgruppenanordnungsauswahlstufe eingelesen werden, 
eine Auswahl aufgrund des Kenndatensatzes getroffen wird 
und dann im Ansprechen auf die Auswahl die Konf igurations- 
daten aus dem Speicher gelesen oder generiert werden. 

5 

19. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , worin bei der Umkonfigu- 
rierung des Feldes zur Durchfuhrung einer Mehrzahl 
zumindest teilweise simultan auszuf iihrender Aufgaben, von 

10 denen fur wenigstens zwei Gruppen zusammen Daten handha- 
bender Elemente in vorbestimmter Weise wahrend der 
Lauf zeit zur Abarbeitung vorgegebener Aufgaben in das Feld 
hinein konfiguriert werden , 

eine Mehrzahl von solchen Elementgruppenanordnungen, die 
15 zur Abarbeitung der vorgegebenen Aufgabe geeignet sind, 
vorbestimmt werden, 

die zu einer gegebenen Zeit und/oder einem gegebenen Er- 
eignis fur die zumindest teilweise simultane 
Hineinkonfiguration verfugbarer Ressourcen bestimmt werden 
20 und jene Elementgruppenanordnungen aus der vorbestimmten 
Anzahl ausgewahlt werden, mit denen eine simultane Abar- 
beitung besonders effizient mQglich . ist . 

20. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
25 oder einem Unteranspruch hierzu , dadurch gekennzeichnet, 

dafi eine erste Elementgruppenanordnung in das Feld hinein- 
konfiguriert wird, mit dieser Elementgruppenanordnung 
begonnen wird, die Aufgabe abzuarbeiten, bis ein vorgege- 
benes Ereignis auftritt und danach unter zumindest 
30 partieller Rekonf iguration mit der Aufgabenabarbeitung in 
einer weiteren Elementgruppenanordnung fortgefahren wird. 

- no - 
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21. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , worin die Elementgrup- 
penanordnungen sich hinsichtlich der 

Abarbeitungsgeschwindigkeit unterscheiden und die Auswahl 
im Ansprechen auf die gegebenenf alls unter Berucksichti- 
gung weiterer Aspekte maximal erzielbare 
Abarbeitungsgeschwindigkeit erf olgt . 

22. Multidimensionales Prozessorfeld aufweisend 

eine Vielzahl benachbart angeordneter Datenverarbeitungs- 
zellen mit 

Eingangen, die Daten von Vernetzungswegen erhalten, 

einer Operanden-Verkniipfungseinheit, die diese entspre- 
chend der jeweiligen Funktion ihrer Operanden- 
Verkniipfungseinheit verkntipfen und 

Ausgangen, um die Daten verkniipft auf Vernetzungswege 
auf zugeben, 

dadurch gekennzeichnet, dali 
die Datenverarbeitungszellen ein Aspektverhaitnis aufwei- 
sen, das wenigstens 2:1, bevorzugt 2:1 betragt. 

23. Multidimensionales Prozessorfeld nach dem vorhergehenden 
Anspruch, dadurch gekennzeichnet, dafi die Datenverarbei- 
tungszellen als grobgranular konf igurierbare Zellen 
ausgebildet sind. 

24. Multidimensionales Prozessorfeld nach dem vorhergehenden 
unabhangigen Anspruch oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet, dafi Datenverarbeitungszellen in 
Reihen und Spalten angeordnet sind. 
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25. Prozessorf eld nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet, dafi zumindest bei einem Teil der Datenver- 
arbeitungszellen Dateneingange vorgesehen sind, um von 
einer oberen Reihe Daten zu erhalten und Datenausgange, um 

5 an eine untere Reihe Daten auszugeben. 

26. Prozessorf eld nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet, dafi die Datenverarbeitungseinheiten EALUs, 
ALU und/oder registerf lankierte Zellen sind. 

10 

27. Verfahren zur Konf igurierung eines Prozessorf eldes nach 
dem vorhergehenden unabhangigen Anspruch oder einem Un- 
teranspruch hierzu , worin Zellen fur die Konfiguration 
ausgewahlt und in Funktion und Vernetzung bestimmt werden, 

15 wobei eine Vernetzung derart bestimmt wird, dafi Daten von 
Zelle zu Zelle zumindest weitgehend verzogerungsf rei uber- 
tragbar sind, dadurch gekennzeichnet, dafi als benachbarte 
Zellen, zwischen denen Daten binnen eines Taktes oder ei- 
ner geringen Taktzahl ubertragbar sind, auch solche 

20 berucksichtigt werden, die nicht unmittelbar nebeneinander 
liegen, sondern in der Breite durch eine Strecke getrennt 
sind, die geringer ist als die Lange der Zelle. 

28. Multidimensionales Prozessorf eld aufweisend 

25 eine Vielzahl benachbart angeordneter Datenverarbeitungs- 
zellen mit 

Eingangen, die Daten von Vernetzungswegen erhalten, 
einer Operanden-Verkntipfungseinheit, die diese entspre- 
chend der jeweiligen Funktion ihrer Operanden- 
30 Verkniipfungseinheit verkniipfen und 

Ausgangen, um die Daten verknupft auf Vernetzungswege 
auf zugeben, 
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dadurch gekennzeichnet, dafi 
die Datenverarbeitungszellen ein Aspektverhaltnis aufwei- 
sen, das wenigstens 2:1, bevorzugt 2:1 betragt. 

5 29. Multidimensionales Prozessorf eld nach dem vorhergehenden 
Anspruch, dadurch gekennzeichnet, dafi die Datenverarbei- 
tungszellen als grobgranular konf igurierbare Zellen 
ausgebildet sind. 

10 30. Multidimensionales Prozessorf eld nach dem vorhergehenden 
unabhangigen Anspruch oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet, dafi Datenverarbeitungszellen in 
Reihen und Spalten angeordnet sind. 



15 31. Prozessorf eld nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet, dafi zumindest bei einem Teil der Datenver- 
arbeitungszellen DateneingSnge vorgesehen sind, urn von 
einer oberen Reihe Daten zu erhalten und Datenausgange, urn 
an eine untere Reihe Daten auszugeben. 

20 

32. Prozessorf eld nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet, dafi die Datenverarbeitungseinheiten EALUs, 
ALU und/oder register flankierte Zellen sind. 



25 33. Verfahren zur Konf igurierung eines Prozessorf eldes nach 
dem vorhergehenden unabhangigen Anspruch oder einem Un- 
teranspruch hierzu , worin Zellen fur die Konf iguration 
ausgewShlt und in Funktion und Vernetzung bestimmt werden, 
wobei eine Vernetzung derart bestimmt wird, dafi Daten von 

30 Zelle zu Zelle zumindest weitgehend verzQgerungsf rei Uber- 
tragbar sind, dadurch gekennzeichnet, dafi als benachbarte 
Zellen, zwischen denen Daten binnen eines Taktes oder ei- 
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ner geringen Taktzahl iibertragbar sind, auch solche be- 
rucksichtigt werden, die nicht unmittelbar nebeneinander 
liegen, sondern in der Breite durch eine Strecke getrennt 
sind, die geringer ist als die Lange der Zelle. 

5 

34. Datenverarbeitungsanordnung mit einem multidimensionalen 
Feld 

in Funktion und/oder Vernetzung konf igurierbarer Zelle- 
lemente und 

10 diesen zugeordneten Konf igurationsvorhaltemitteln zum 

lokalen Konf igurations-Vorhalten, 
dadurch gekennzeichnet , dali 

die Konf igurationsvorhaltemittel dazu ausgebildet sind, 
zumindest einen Teil der vorgehaltenen Konf igurationen 
15 nicht fluchtig vorzuhalten. 

35. Datenverarbeitungsanordnung mit einem multidimensionalen 
Feld 

in Funktion und/oder Vernetzung konfigurierbarer Zelle- 
20 lemente und 

diesen zugeordneten Konfigurationsvorhaltemitteln zum 
lokalen Konf igurations-Vorhalten, 
dadurch gekennzeichnet, dafi 
die Konf igurationsvorhaltemittel dazu ausgebildet sind, 
25 zumindest einen Teil der vorgehaltenen Konf igurationen 
nicht fluchtig vorzuhalten. 

36. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
abhangigen Anspruch oder einem Unteranspruch hierzu , 

30 dadurch gekennzeichnet, dafi die Funktion grobgranular kon- 
figurierbar ist. 
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37. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
abhangigen Anspruch oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet, dafi die Vernetzung grobgranular 
konf igurierbar ist. 

5 

38. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
abhangigen Anspruch Oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet, dafi als Zellelemente zumindest ei- 
nes von ALUs, EAlUs f RAM-Zellen, I/O-Zellen, Logiblocken 

10 vorgesehen sind. 

39. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
abhangigen Anspruch oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet, dafi jedem Zellelement ein eigenes 

15 Konfigurationsvorhaltemittel zugeordnet ist. 

40. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
abhangigen Anspruch oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet, dafi die Konf igurationsvorhaltemit- 

20 tel dazu ausgebildet sind, eine Vielzahl von 
Konf igurationen vorzuhalten. 

41. Datenverarbeitungsanorndung, dadurch gekennzeichnet, dafi 
mehrere fest vorgegebene nichtf ltichtige Konf igurationen im 

25 Konfigurationsvorhaltemittel vorgegeben sind. 

42. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
abhangigen Anspruch oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet, dafi die Anordnung dazu ausgebildet 

30 ist, eine wechselnde einer Vielzahl von vorgehaltenen Kon- 
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figurationen zu verwenden, insbesondere im Wege der Wa- 
ve-Rekonfiguration oder des lokalen Sequencing. 

43. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
5 abhangigen Anspruch oder einem Unteranspruch hierzu , 

dadurch gekennzeichnet, dafi bei eingien Zellen im Betrieb 
mit veranderlichen Konf igurationen versehbare Konf igurati- 
onsvorhaltemittel vorgesehen sind. 

10 44. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
abhangigen Anspruch oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet, dafi als Konf igurationsvorhaltemit- 
tel zunmindest eines aus ROM, EPROM, EE PROM, Flash- 
Speicher, Fuse-, Antifuse-programmierbare Speichermittel 

15 und/oder in insbesondere in oberen Lagen einer Silizium- 
struktur fest vorgesehene Speichermittel gewahlt sind. 

45. Verfahren zur Herstellung einer dedizierten Datenverar- 
beitungsanordnung, dadurch gekennzeichnet, dafi ein 

20 multidimensionales Feld mit in Funktion und/oder Vernet- 
zung konfigurierbaren Zellelemente und diesen zugeordneten 
Konfigurationsvorhaltemitteln zum lokalen Konf igurations - 
Vorhalten vorgegeben wird, bestimmt wird, welche Konfigu- 
rationen in diesen vorzuhalten sind, und dann 

25 nichtfliichtige Konf igurationsvorhaltemittel so vorgesehen 
werden, dafi sie zumindest einen Teil der vorgehaltenen 
Konf igurationen nichtf luchtig vorhalten. 

46. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
30 kennzeichnet, dafi von einem zur lauf zeitrekonfigurierbaren 

multidimensionalen Feld ausgegangen wird. 
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47. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dafi zunachst von einem zur 

lauf zeitrekonfigurierbaren multidimensionalen Feld mit re- 
konf igurationsbeschaltung ausgegangen wird und dann fur 
rekonf iguration nichtbenotigte Felder weggelassen werden. 

48. Rekonf igurierbare Signalverarbeitungsvorrichtung mit ei- 
ner Vielzahl von miteinander, insbesondere konf igurierbar 
verkniipfbaren Signalverarbeitungsschaltkreisen, die in 
ihrer Funktion veranderlich sind, wobei diese einen Aus- 
gang aufweisen, uber welchen eine Umkonf igu-rierung 
angefordert und/oder eine Akzeptierung einer Umkonfigura- 
tion vorgesehen werden kann, dadurch gekennzeichnet, dass 
zumindest ein Teil der verkniipfbaren Signalverarbeitungs- 
schaltkreise analoge Signalverarbeitungsschaltkreise 
sind/ wobei weiter eine Rekonf igurationseinheit zur Vor- 
gabe von Konf igurationen fur die das Analogsignal 
verarbeitenden Schaltkreise vorgesehen ist. 

49. Rekonf igurierbare Signalverarbeitungsvorrichtung nach dem 
vorhergehenden Anspruch, dadurch gekennzeichnet , dass ein 
Teil der Signalverarbeitungsschaltkreise digitale Schalt- 
kreise sind. 

50. Datenverarbeitungsvorrichtung mit einem Datenverar- 
beitungslogikzellenfeld und zumindest einer Sequenziell- 
CPU, dadurch gekennzeichnet, dass eine Ankopplung der Se- 
quenziell-CPO und des Datenverarbeitungslogikzellenfeldes 
zum Datenaustausch in insbesondere blockweiser Form durch 
zu einem Cache-Speicher fiihrende Leitungen m5glich ist. 
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51. Verfahren zum dynamischen Aufbau 

einer Verbindung zwischen einem Sender und einem Empfan- 
ger 

iiber einen einer Vielzahl moglicher Wege, der von Station 
zu Station fortschreitet, 

dadurch gekennzeichnet, dass 

ausgehend von einer den Busaufbau wirkenden Einheit (Sen- 
der und/oder Empfanger) eine Anfrage an nachstliegende 
Stationen gesandt wird, welche fur den Busaufbau bereit 
stehen, 

diesen Stationen eine Kennziffer zugeordnet wird, 
ausgehend von wenigstens einer Vielzahl, bevorzugt jeder 
freien Station, der eine Kennziffer zugeordnet wurde, ei- 
ne Anfrage an nachstliegende Stationen nach der 
Verfugbarkeit der Stationen fur einen Busaufbau gesandt 
wird, 

den verfugbaren Stationen eine weitere Kennziffer zuge- 
ordnet wird, und dies fortgesetzt wird, bis das 
gewunschte Ende des Busses erreicht ist. 

52. Verfahren nach dem vorhergehenden Anspruch, worin von 

Station zu Station, die jeweils far ein Fortschreiten des 
Busaufbaus verfugbar ist, unabhangig davon, ob mit dieser 
Station das Ziel erreicht werden wird oder nicht, eine 
veranderte Kennziffer zugewiesen wird. 

53. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dass die Veranderung von Station zu Station 
nachvollziehbar gewahlt wird, wobei insbesondere eine In- 
crement ie rung oder Decrementierung eines Zahlwertes um 
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eine feste Grolie erfolgt, insbesondere mit Schrittweite 
gegebenenfalls durch zyklisches Zahlen, d.h. Zahlen in 
einem endlichen, zyklischen Zahlenraum. 



5 54. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dass zyklisch bis mindestens drei 
verschiedene Zahlwerte zur Charakterisierung der Station 
durchgezahlt werden. 

10 55. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , dadurch gekennzeich- 
net, dafi nach Aufbau eines Bus-Weges zwischen Sender und 
Empfanger nicht benotigte Stationen wieder freigegeben 
werden. 



15 



20 



56. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , dadurch gekennzeichnet, 
dass ein Bus als aufgebaut betrachtet wird, sobald von 
einer Station aus das Ziel erreicht worden ist. 

57. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dass nach dem Aufbau eines ersten Busses 
der Aufbau weiterer Busverbindungen unterbunden wird. 



25 58. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dass den an einem aufgebauten Bus 
beteiligten Stationen das Erreichen des Busaufbaues mit- 
geteilt wird. 



30 59. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dass den an einem aufgebauten Bus 
beteiligten Stationen das Erreichen des Busaufbaues mit- 
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geteilt wird, 

indent ausgehend vom Ziel in Riickwartsrichtung den am Bus 
beteiligten Stationen ein Busbeteiligungssignal zugesandt 
wird, insbesondere durch Obertragen von Signalen entlang 
5 des Busses. 

60. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dass die Identif ikation der am aufgebauten 
Bus beteiligten Stationen erfolgt, indem ausgehend vom 
10 Ziel die den erreichbaren Stationen gegebenenfalls zuge- 

ordneten Zahlenwerte verglichen werden und jene Stationen 
ausgewahlt werden, die einen buszugehdrigkeitsindikativen 
Zahlenwert besitzen. 



15 61. Verfahren nach dem vorhergehenden Anspruch, worin ausge- 
hend von einer Startposition die Zahlenwerte 
incrementiert werden, wShrend beim Busaufbau von Station 
zu Station fortgeschritten wird und worin nach Erreichen 
des Ziels jene Stationen als zum Bus zugehorig identif i- 

20 ziert werden, die jeweils die kleinsten Zahlenwerte 

erreichbarer Stationen besitzen. 



62. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dass eine Freigabe nicht fur eine 

25 Busverbindung benotigter Stationen durch Markierung jener 

Stationen, die an einem aufgebauten, benotigten Bus teil- 
haben, und Freigeben aller nicht dergestalt markierten 
Stationen, insbesondere durch das Senden eines globalen 
Freigabesignals erfolgt. 

30 

63. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , dadurch gekennzeichnet, 
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dass die Freigabe nicht benotigter Stationen wellenartig 
durch Zuriicklaufen von einer Ziel- zu einem Starteinheit 
erfolgt und/oder durch Ruckwartslauf en vom Ziel zum Start 
unter Freigabe nicht benotigter Stationen durch Senden 
eines Freigabesignals durch jeweils jene Station, die bei 
der freizugebende Station zuvor angefragt hatte, ob sie 
fiir den Busaufbau zur Verfugung stehe. 

64. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , worin simultan eine 
Vielzahl von Busverbindungen aufgebaut wird, dadurch ge- 
kennzeichnet, dass zu jeder fiir den Aufbau einer 
Busverbindung angesprochehen Station ein Richtungswert 
zugeordnet wird, insbesondere in der Station abgespei- 
chert wird, der angibt, aus welcher Richtung oder von 
welcher ansprechenden Station ein Busaufbauanforderungs- 
signal erhalten wurde. 

65. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dass die Busverifikation durch Auswertung 
der Signale erfolgt, die anzeigen, von welcher anspre- 
chenden Station aus ein Busaufbauanforderungssignal 
gesandt wurde und worin der Busaufbau zu dieser anfor- 
dernden Station hin erfolgt • 

66. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , dadurch gekennzeichnet, 
dass bei Vorliegen mehrerer, eine gleiche Anzahl von Sta- 
tionen benotigender Busse, die potenziell aufbaubar sind, 
ein Bus anhand eines dem Bus zuweisbaren und/oder zuge- 
wiesenen Beurteilungskriterium ausgewahlt wird. 
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67. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dass als Busbeurteilungskriterium die 
Anzahl horizontal und/oder vertikal durchlauf ender Sta- 
tionen und/oder die Anzahl registerbehaf teter Stationen 
5 und/oder die Verbindungsdichte existierender Busverbin- 

dungen langs der Stationen und/oder die Grofie 
verbleibender freier Felder, die nicht durch den Bus ver- 
teilt werden, herangezogen wird. 



10 68, Multidimensionales Feld rekonf igurierbarer Elemente, wo- 
bei zumindest zwischen einigen der konf igurierbaren 
Elemeninte dynamisch aufbaubare Busse vorgesehen sind, da- 
durch gekennzeichnet, dass im Bussystem Einheiten 
vorgesehen sind, die dazu ausgebildet sind, direkt oder 

15 uber Fernbusse indirekt benachbarte Gruppen in Bussegmen- 

ten anzusprechen und/oder eine Busstationsnummer zu 
speichern und/oder eine BefOrderungssignalrichtung zu 
speichern und/oder einen Abbau von temporar gehaltenen 
Verbindungen zu womSglich fur einen Busaufbau benotigten 

20 Stationen nach Feststellung des Nichtbenotigens durch 

Freigabe zu ermoglichen. 



69. Datenverarbeitungsvorrichtung mit einem Datenverarbei- 
tungslogikzellenfeld und zumindest einer Sequenziell-CPU, 
25 dadurch gekennzeichnet , dass eine Ankopplung der Sequen- 

ziell-CPU und des Datenverarbeitungslogikzellenf eldes zum 
Datenaustausch in insbesondere blockweiser Form durch zu 
einem Cache-Speicher fiihrende Leitungen mSglich ist. 
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M ' □ Use of (staggered) Jong tracks* 



! PACIT • ■ increases operating frequency 
r ■ Decreases transistor count and area 





PACT;.; 



□Three additional strategies: 

■ Operate at different frequencies, 

• MIPS MP Core at 400 MHz 
- PACT XPP Core at 200 MHz 
> Registers In each bus-connect 

■ PAEs act sequentially, one output each 2nd or 4th dock cycle 




Fig. 6 
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□Trade-off between area and sequentiallity 

* Basic operation of compiler technology can be used to achieve 
abstraction layer 

" Generate .compressed" configurations, which are expanded on 
larger arrays while loading 

• No minimum array but maximum array defined by compiler setting 
• Tradeoff: Number of (reconfigurations vs. usable ALU-PAEs 
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Gjl Fig. 8a 
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Q Basic Operation Method 

• LOAD/STORE processor 

■ RAM-PAEs act as Vector-Registers (2D/3D) 

■ Irregular data access patterns are linearized by 
LOAD/STORE while accessing RAM-PAEs 

• Can be done by uP also! 

■ LOAD ... Con^ ... Con£ Con£... STORE 

■ Each Configuration is regarded as an OpCode 

■ No Configuration/Array internal status 

□ Code Analysis 

■ Data Dependency Analysis 

• Data Flow Analysis 

■ Interprocedural Alias Analysis 

• Pointer analysts: statically allocated data, dynamically allocated data 

> Interprocedural Value Range Analysis 
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□ Code Optimizations . 




■ Loop Transformations 






• Loop Normalization 


• Strength Reduction 


' ' ■ 1 


• Loop Reversal 


• Induction Variable Beminatfon 


j 


• Loop-Invariant Code Motion 


• Strip Mining 


" ^ 


• Loop Unswrtching 


• Scalar Expansion 




• Loop Interchange 


• Array Contracting/Shrinking 




* Loop Tiling 


• Scalar Replacement 


'■ - j ' 


• Loop Skewing 


• Reduction Recognition 


• * • 1 


• Loop Coalescing/Collapsing 


* Idiom Recognition 
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□ RAM-PAEs RAM is .embedded" into cache 

□ RAM-PAEs can operate like cache-lines 

• Homogeneous embedded in cache 

■ Handling access rights between uP and XPP 

• Handling context switching / hyperthreading 

• Abstracting non linear address patterns 
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PACO ! □ XPP operates like an RISC-Processor 

i □ RAM-PAEs act like registers 

. j □ Each configuration is atomar (unbreakable 

.] □ Configurations running time is limited 

> , ; □ LOAD Configuration 

.. ■ Loads external data into internal RAM-PAEs 

( " Q Data operations (one or multiple configurations) 
- :; : '*?,] • Unbreakable - no Internal status to be saved! 

j Q STORE Configuration 

>/V; 1 ■ Stores internal data into external RAM-PAEs 



O Interrupts (Task/ThreaoVSwitches) only between 
(re)configurations no$ at runtime 
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□XPP Technology allows sequential 
processing 

• Within ALU-PAEs using the configuration register fOe as a random 

access code memory 
« Coupling an ALU-PAE with a RAM-PAE. ALU-PAE acts like a uC, 
RAM-PAE is according Data- and Code-Memory 
• As an enhancement IO-PAEs can be used to access perfpheriate and 
external memory «. 



Fig. 21 
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; :, ^ j| □ Handled by sequential processing within PAEs 

" Floating-Point, Division etccan be emulated by 
8 ^ sequential multicycle PAE operations 

fe'jrv'-i " H *9 her precision is calculated asa multicycle operation 
■ * results are transfered in two bus cycles 
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